最贊回答 / 無概念
它們都支持流式計算,Fink是一行一行處理,是基于操作符的連續流模型,而Spark是基于數據片集合(RDD)進行小批量處理,所以Spark在流式處理方面會增加一些延遲。Flink可以支持毫秒級計算,而Spark則只能支持秒級計算。如果是要求對實時性要求非常高的場景(如高頻實時交易),Spark是難以滿足的,可以考慮Flink或Storm。
2020-10-28
最贊回答 / 莊學爸
好吧,自問自答,懂了。視頻上說sliding size為5s,其實就是每隔5s計算一次最近30s出現的數據,那么肯定數據是會重疊的,因為滑動窗口之間的時間線會有重疊。?
2020-06-27
我發現一個的flink介紹網站:https://ververica.cn/developers/flink-training-course1/
2020-03-03