亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定

spark創建rdd,DataFrame,Spark SQL

標簽:
Spark
# coding=utf8from pyspark import SparkConf, SparkContextfrom pyspark.sql import SparkSession, Row'''
基本RDD“转换”运算
'''conf = SparkConf().setMaster("local").setAppName("My App")
sc = SparkContext(conf=conf)global Pathif sc.master[0:5] == 'local':
    Path = '1.txt'# print sc.master# print Path#######################   创建RDD    ###########################textRdd = sc.textFile(Path)print textRdd.count()print textRdd.take(5)

userRdd = textRdd.map(lambda line: line.split(','))print userRdd.take(5)#######################    创建DataFrame    ############################ 创建sqlContextsqlContext = SparkSession.builder.getOrCreate()# 定义schemauser_rows = userRdd.map(lambda p:
                        Row(
                            userid=int(p[0]),
                            age=int(p[1]),
                            gender=p[2],
                            work=p[3],
                            zipcode=p[4]
                        )
                        )print user_rows.collect()# 创建DataFramesuser_df = sqlContext.createDataFrame(user_rows)
user_df.printSchema()
user_df.show()# 为DataFrame创建别名udf = user_df.alias('udf')
udf.show()#######################   使用spark sql   ############################ 登录临时表user_df.registerTempTable('user_table')# 查看项数sqlContext.sql('select count(*) counts from user_table').show()# 多行输入spark sql语句sqlContext.sql('''
select count(*) 
counts 
from user_table
''').show()# 使用spark sql查看数据# 使用Spark SQL limit指定要显示的项数sqlContext.sql('select * from user_table limit 5').show()

1.txt内容:

1,24,M,technician,85711
2,53,F,other,94043
3,23,M,writer,32067
4,24,M,technician,43537
5,33,F,other,16213



作者:BlueCat2016
链接:https://www.jianshu.com/p/cb0d4f5709e6


點擊查看更多內容
TA 點贊

若覺得本文不錯,就分享一下吧!

評論

作者其他優質文章

正在加載中
  • 推薦
  • 評論
  • 收藏
  • 共同學習,寫下你的評論
感謝您的支持,我會繼續努力的~
掃碼打賞,你說多少就多少
贊賞金額會直接到老師賬戶
支付方式
打開微信掃一掃,即可進行掃碼打賞哦
今天注冊有機會得

100積分直接送

付費專欄免費學

大額優惠券免費領

立即參與 放棄機會
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號

舉報

0/150
提交
取消