Apache Flink和Apache Spark有什么異同?
2 回答

加米谷大數據
TA貢獻12條經驗 獲得超0個贊
Apache Fink是一種大規模的數據處理工具,它以大數據量的低數據延遲和高容錯性快速處理大數據。它的定義特征是它能夠實時處理流數據。
Apache Spark是專為大規模數據處理而設計的快速通用的計算引擎,是一種與 Hadoop 相似的開源集群計算環境。
相同點:
都是apache 軟件基金會(ASF)旗下頂級項目,都是通用數據處理平臺。它們可以應用在很多的大數據應用和處理環境。兩者均可在不依賴于其他環境的情況下運行于standalone模式,或是運行在基于hadoop(YARN,HDFS)之上,由于它們均是運行于內存,所以他們表現的都比hadoop要好很多。
二者的不同:
Flink在進行集合的迭代轉換時可以是循環或是迭代計算處理。flink的流式處理的是真正的流處理。流式數據一旦進入就實時進行處理,這就允許流數據靈活地在操作窗口。
Spark 在另一方面是基于彈性分布式數據集(RDD),這(主要的)給于spark基于內存內數據結構的函數式編程。它可以通過固定的內存給于大批量的計算。
- 2 回答
- 0 關注
- 1201 瀏覽
添加回答
舉報
0/150
提交
取消