亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定

spark 將DataFrame所有的列類型改為double

標簽:
Spark

转载请务必注明原创地址为:

+----+|col1|+----+| 1.0|| 6.0|+----+

2、循环转变

然后就想能不能用这个方法循环把每一列转成double,但没想到怎么实现,可以用withColumn循环实现。

val colNames = df.columnsvar df1 = dffor (colName <- colNames) {
  df1 = df1.withColumn(colName, col(colName).cast(DoubleType))
}
df1.show()
+----+----+----+----+----+|col1|col2|col3|col4|col5|+----+----+----+----+----+| 1.0| 2.0| 3.0| 4.0| 5.0|| 6.0| 7.0| 8.0| 9.0|10.0|+----+----+----+----+----+

3、通过:_*

但是上面这个方法效率比较低,然后问了一下别人,发现scala 有array:_*这样传参这种语法,而df的select方法也支持这样传,于是最终可以按下面的这样写

val cols = colNames.map(f => col(f).cast(DoubleType))
df.select(cols: _*).show()
+----+----+----+----+----+|col1|col2|col3|col4|col5|+----+----+----+----+----+| 1.0| 2.0| 3.0| 4.0| 5.0|| 6.0| 7.0| 8.0| 9.0|10.0|+----+----+----+----+----+

这样就可以很方便的查询指定多列和转变指定列的类型了:

val name = "col1,col3,col5"df.select(name.split(",").map(name => col(name)): _*).show()
df.select(name.split(",").map(name => col(name).cast(DoubleType)): _*).show()
+----+----+----+|col1|col3|col5|+----+----+----+|   1|   3|   5||   6|   8|  10|+----+----+----+

+----+----+----+|col1|col3|col5|+----+----+----+| 1.0| 3.0| 5.0|| 6.0| 8.0|10.0|+----+----+----+

附完整代码:

package com.dkl.leanring.spark.testimport org.apache.spark.sql.SparkSessionimport org.apache.spark.sql.types._import org.apache.spark.sql.DataFrameobject DfDemo {  def main(args: Array[String]): Unit = {    val spark = SparkSession.builder().appName("DfDemo").master("local").getOrCreate()    import org.apache.spark.sql.types._    val data = Array(("1", "2", "3", "4", "5"), ("6", "7", "8", "9", "10"))    val df = spark.createDataFrame(data).toDF("col1", "col2", "col3", "col4", "col5")    import org.apache.spark.sql.functions._
    df.select(col("col1").cast(DoubleType)).show()    val colNames = df.columns    var df1 = df    for (colName <- colNames) {
      df1 = df1.withColumn(colName, col(colName).cast(DoubleType))
    }
    df1.show()    val cols = colNames.map(f => col(f).cast(DoubleType))
    df.select(cols: _*).show()    val name = "col1,col3,col5"
    df.select(name.split(",").map(name => col(name)): _*).show()
    df.select(name.split(",").map(name => col(name).cast(DoubleType)): _*).show()

  }



作者:董可伦
链接:https://www.jianshu.com/p/0634527f3cce


點擊查看更多內容
TA 點贊

若覺得本文不錯,就分享一下吧!

評論

作者其他優質文章

正在加載中
  • 推薦
  • 評論
  • 收藏
  • 共同學習,寫下你的評論
感謝您的支持,我會繼續努力的~
掃碼打賞,你說多少就多少
贊賞金額會直接到老師賬戶
支付方式
打開微信掃一掃,即可進行掃碼打賞哦
今天注冊有機會得

100積分直接送

付費專欄免費學

大額優惠券免費領

立即參與 放棄機會
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號

舉報

0/150
提交
取消