-
sprak 快速,擴充了mapreduce計算模型 基于內存計算 通用 批處理 迭代式計算 交互查詢 流處理 優點 降低維護成本 高度開放 有python java scala 與 hadoop kalfka查看全部
-
spark安裝查看全部
-
lazy evaluation 延遲計算,有點類似hibernate的延遲加載查看全部
-
foreach() 結果不返回到本地查看全部
-
spark 和hadoop的比較 應用場景 hadoop的中間數據落在硬盤上 時效性不好 spark是基于內存的,中間數據在硬盤上,計算時間是秒級的 spark適合于機器學習 spark不具有HDFS的存儲能力,要借助HDFS等持久化數據查看全部
-
spark有很多組件(緊密集成): spark core spark sql spark streaming(實時流處理) Mlib(機器學習) Graphx 圖計算 繼承了RDD API Cluster Managers 集群管理 緊密集成的優點:-----查看全部
-
spark是一個快速并且通用的集群計算平臺 快速:t級別 秒級別 spark是基于內存的計算 spark的功能:批處理 迭代式計算 交互查詢 流計算 spark是高度開放的 :提供了python java Scala sql的API 與其他的大數據工具整合的很好查看全部
-
rdd不可改變查看全部
-
resilient distributed datasets查看全部
-
不錯查看全部
-
Action查看全部
-
啟動master、worker 提交作業查看全部
-
mark查看全部
-
緊密集成的優點: Spark底層優化了,基于Spark底層的組件,也得到了相應的優化. 緊密集成,節省了各個組件組合使用時的步數,測試等時間. 向Spark增加新的組件時,其他組件,可立刻享用新組件的功能.查看全部
-
Cluster Managers:集群管理,Spark自帶一個集群管理是單獨調度器.查看全部
舉報
0/150
提交
取消