亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

Pyspark - 將列轉換為列表

Pyspark - 將列轉換為列表

尚方寶劍之說 2023-06-06 14:59:10
火花3.0我運行了一個代碼df.select("Name").collect(),并在下面收到了這個輸出。我想將結果放在下面的列表中。我嘗試將 [0] 添加到末尾,但這沒有用。Row(Name='Andy')Row(Name='Brandon')Row(Name='Carl')expected outcome = ['Andy','Brandon','Carl']
查看完整描述

2 回答

?
大話西游666

TA貢獻1817條經驗 獲得超14個贊

你可以使用 rdd。

df.select('Name').rdd.map(lambda x: x[0]).collect()

['Andy', 'Brandon', 'Carl']


查看完整回答
反對 回復 2023-06-06
?
飲歌長嘯

TA貢獻1951條經驗 獲得超3個贊

使用collect_list然后通過訪問索引僅獲取列表并分配給變量。


Example:


df.show()

#+-------+

#|   Name|

#+-------+

#|   Andy|

#|Brandon|

#|   Carl|

#+-------+


output=df.agg(collect_list(col("name"))).collect()[0][0]


output

#['Andy', 'Brandon', 'Carl']

另一種方法是使用列表理解:


ss=df.select("Name").collect()


output=[i[0] for i in ss]


output

#['Andy', 'Brandon', 'Carl']


查看完整回答
反對 回復 2023-06-06
  • 2 回答
  • 0 關注
  • 280 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號