亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

如何使用 Spark 更改所有數據集中的非數值?

如何使用 Spark 更改所有數據集中的非數值?

瀟瀟雨雨 2022-10-07 16:17:28
我正在使用一個包含很多列的數據集,這個數據集有?在所有數據集中。我想用 Spark (Java) 來改變 ? 到 0。到目前為止,我只能用一列做到這一點,但我想在任何地方都這樣做:    Dataset<Row> csvData = spark.read()            .option("header", false)            .option("inferSchema", true)            .option("maxColumns", 50000)            .csv("src/main/resources/K9.data");    csvData = csvData.withColumn("_c5409", when(col("_c5409").isNull(),0).otherwise(col("_c5409")) )        .withColumn("_c0", when(col("_c0").equalTo("?"),0).otherwise(col("_c0")) );也許這有一個簡單的解決方案,我是 Java 和 Spark 的新手 :)
查看完整描述

1 回答

?
UYOU

TA貢獻1878條經驗 獲得超4個贊

您可以使用 when 創建列列表,并在 select 中使用它是否必須處理復雜的 if 和 else 情況


List<org.apache.spark.sql.Column> list = new ArrayList<org.apache.spark.sql.Column>();

for( String col : csvData.columns()){

    list.add(when(csvData.col(col).isNull(),0).otherwise(csvData.col(col)).alias(col));

}

csvData = csvData.select(list.toArray(new org.apache.spark.sql.Column[0]));


如果只是簡單地替換空值,這就足夠了


csvData = csvData.na().fill(0, df.columns()); 


查看完整回答
反對 回復 2022-10-07
  • 1 回答
  • 0 關注
  • 88 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號