亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

Spark Java 重新分區

Spark Java 重新分區

Smart貓小萌 2023-05-10 13:41:08
Java spark2這兩個語句有什么區別-Dataset<Row> Data; Data.repartition(new Column("key" )) ; and Data.repartition(Data.col("key" ) ;
查看完整描述

1 回答

?
千巷貓影

TA貢獻1829條經驗 獲得超7個贊

正在做

Data.repartition(new?Column("key"));

相當于

import?static?org.apache.spark.sql.functions.col;
Data.repartition(col("key"));

在這些情況下,該列不直接與數據集相關聯,Spark 需要在分析階段解析它。

如果你改用

Data.repartition(Data.col("key");

您正在向 Spark 發出指令,該指令是該列所屬的數據集。此方法主要用于連接,例如,您可以擁有兩個具有公共列名的數據集。

在您的示例中,結果是等效的,您可以使用兩種形式。


查看完整回答
反對 回復 2023-05-10
  • 1 回答
  • 0 關注
  • 147 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號