首頁手記舊版spark（1.6版本）...

舊版spark（1.6版本）將rdd動態轉為dataframe

標簽：

Spark

转载请务必注明原创地址为：

1、新版

1.2 代码

新版代码较简单，直接通过spark.read.option("header", "true").csv(data_path)即可实现！

package com.dkl.leanring.spark.sqlimport org.apache.spark.sql.SparkSessionobject Txt2Df {  def main(args: Array[String]): Unit = {    val spark = SparkSession.builder().appName("Txt2Df").master("local").getOrCreate()    val data_path = "files/data.csv"
    val df = spark.read.option("header", "true").csv(data_path)
    df.show()
  }
}

1.3 结果

+----+----+----+----+----+|col1|col2|col3|col4|col5|+----+----+----+----+----+|  11|  12|  13|  14|  15||  21|  22|  23|  24|  25||  31|  32|  33|  34|  35||  41|  42|  43|  44|  45|+----+----+----+----+----+

2、旧版

2.2 代码

package com.dkl.leanring.spark.sqlimport org.apache.spark.SparkConfimport org.apache.spark.SparkContextimport org.apache.spark.sql.SQLContextimport org.apache.spark.sql.types._import org.apache.spark.sql.Rowobject Rdd2Df {  def main(args: Array[String]): Unit = {    val conf = new SparkConf().setAppName("Rdd2Df").setMaster("local")    val sc = new SparkContext(conf)    val sqlContext = new SQLContext(sc)    import sqlContext.implicits._    val data_path = "files/data.txt"
    val data = sc.textFile(data_path)    val arr = data.collect()    //arr1为除去第一行即列名的数据
    val arr1 = arr.slice(1, arr.length)    val rdd = sc.parallelize(arr1)    //列名
    val schema = StructType(arr(0).split(",").map(fieldName => StructField(fieldName, StringType, true)))    val rowRDD = rdd.map(_.split(",")).map(p => Row(p: _*))
    sqlContext.createDataFrame(rowRDD, schema).show()

  }
}

2.3 结果

+----+----+----+----+----+|col1|col2|col3|col4|col5|+----+----+----+----+----+|  11|  12|  13|  14|  15||  21|  22|  23|  24|  25||  31|  32|  33|  34|  35||  41|  42|  43|  44|  45|+----+----+----+----+----+

根据结果看，符合逾期的效果！

作者：董可伦
链接：https://www.jianshu.com/p/93d0c7a8eae5

點擊查看更多內容

為 TA 點贊

若覺得本文不錯，就分享一下吧！

評論

評論

共同學習，寫下你的評論

評論加載中...

展開查看更多評論

作者其他優質文章

正在加載中

慕標5832272

全棧工程師

手記
篇

粉絲

233

獲贊與收藏

1006

關注作者，訂閱最新文章

閱讀免費教程

后端通用面試教程

41個小節 32074 358

網絡編程入門教程

20個小節 13196 249

Pandas 入門教程

25個小節 19570 369

推薦

評論

收藏

共同學習，寫下你的評論



感謝您的支持，我會繼續努力的～

掃碼打賞，你說多少就多少

贊賞金額會直接到老師賬戶

支付方式

打開微信掃一掃，即可進行掃碼打賞哦

今天注冊有機會得

100積分直接送

付費專欄免費學

大額優惠券免費領

立即參與放棄機會

點擊
抽獎

慕課手記新用戶專享福利

恭喜你，你的運氣太好了，居然抽中了 100個積分！

恭喜你，抽中了價值元的專欄！

太棒了，直接落到你賬戶里！

積分商城里的羅技鼠標、機械鍵盤、
Kindle 閱讀器、小米平衡車
Apple iPad （10.2英寸）、大額優惠券
在等著你去兌換了噢

作者：

免費贈送

兌換碼：1111222211 復制

優惠券可用于購買實戰課、體系課
無門檻使用

先去看看，有什么好東西馬上兌換我愛學習，選課去


亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

舊版spark（1.6版本）將rdd動態轉為dataframe

1、新版

1.1 数据

1.2 代码

1.3 结果

2、旧版

2.1 数据

2.2 代码

2.3 结果

閱讀免費教程

熱搜

最近搜索清空

舊版spark（1.6版本） 將rdd動態轉為dataframe

閱讀免費教程

舊版spark（1.6版本）將rdd動態轉為dataframe