亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定

Spark Basic RDD 操作示例

標簽:
Spark

Transformation

基本 RDD 的 transformation

假设有一个 RDD ,其中的元素有 {1, 2, 3, 3}:

函数目的示例结果
map()将函数应用到 RDD 中的每一个元素并以 RDD 的形式返回结果rdd.map(x => x+1){2, 3, 4, 4}
flatMap()将函数应用到 RDD 中的每一个元素,并以 RDD 的形式返回 iterator 的内容。通常用于提取词语。rdd.flatMap(x => x.to(3)){1, 2, 3, 2, 3, 3, 3}
filter()返回一个 RDD, 该 RDD 中仅包含了能够通过 filter() 函数的元素rdd.filter(x => x != 1){2, 3, 3}
distinct()去除重复项rdd.distinct(){1, 2, 3}

两个 RDD 的 transformation

假设有两个 RDD, 分别包含了 {1, 2, 3} 和 {3, 4, 5}:

函数目的示例结果
union()并集,生成一个包含了两个 RDD 元素的 RDDrdd.union(other){1, 2, 3, 3, 4, 5}
intersection()交集,生成 RDD 包含了在两个 RDD 中同时出现的元素rdd.intersection(other){3}
subtract()移除一个 RDD 中的内容rdd.subtract(other){1, 2}
cartesian()以另一个 RDD 的 笛卡尔积rdd.cartesian(other){(1, 3), (1, 4), (1, 5), (2, 3), (2, 4)}, ..., (3, 5)

Action

假设有一个 RDD ,其中的元素有 {1, 2, 3, 3}:

函数目的示例结果
collect()返回 RDD 中的所有元素rdd.collect(){1, 2, 3, 3}
count()RDD 中的元素数目rdd.count()4
countByValue()RDD 中每个元素出现的次数rdd.countByValue(){(1, 1), (2, 1), (3, 2)}
take(num)返回 RDD 中的 num 个元素rdd.take(2){1, 2}
top(num)返回 RDD 中的前 num 个元素rdd.top(2){3, 3}
takeOrdered(num)(ordering)基于 ordering 返回 num 个元素rdd.takeOrdered(2)(myOrdering){3, 3}
takeSample(withReplacement, num, [seed])随机返回 num 个元素rdd.takeSample(false, 1)不确定
reduce(func)并行地组合 RDD 中的元素(比如,sum)rdd.reduce((x, y) => x + y)9
fold(zero)(func)reduce() 一样只是需要提供一个 0rdd.fold(0)((x, y) => x + y)9
aggregate(zeroValue)(seqop, combop)reduce() 相似,不过用于返回不同类型rdd.aggregate((0, 0))((x, y) => (x._1 + y, x._2 + 1), (x, y) => (x._1 + y._1, x._2 + y._2))(9, 4)
foreach(func)将 func 应用到 RDD 中的每一个元素rdd.foreach(func)

以上内容参见 <<Learning Spark>>, 其代码示例可在 GitHub 上找到 learning-spark.



作者:liuchengxu
链接:https://www.jianshu.com/p/5b03412e5691


點擊查看更多內容
TA 點贊

若覺得本文不錯,就分享一下吧!

評論

作者其他優質文章

正在加載中
軟件工程師
手記
粉絲
47
獲贊與收藏
152

關注作者,訂閱最新文章

閱讀免費教程

  • 推薦
  • 評論
  • 收藏
  • 共同學習,寫下你的評論
感謝您的支持,我會繼續努力的~
掃碼打賞,你說多少就多少
贊賞金額會直接到老師賬戶
支付方式
打開微信掃一掃,即可進行掃碼打賞哦
今天注冊有機會得

100積分直接送

付費專欄免費學

大額優惠券免費領

立即參與 放棄機會
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號

舉報

0/150
提交
取消