-
批量計算 流式計算 數據到達 計算開始前數據已準備好 計算進行中數據持續到來 計算周期 計算完成后會結束計算 一般會作為服務持續運行 使用場景 時效性要求低的場景 時效性要求高的場景查看全部
-
流式計算和批量計算的整合,目前的工具有查看全部
-
Grouping方式查看全部
-
Nimbus查看全部
-
111查看全部
-
Trident API替代了transcation API保證事務查看全部
-
石頭查看全部
-
分布式查看全部
-
hdoop查看全部
-
google的三篇論文查看全部
-
Nimbus掛掉,換臺機器重啟就可 supervisor掛掉,將上面的worker遷移走就可以 worker掛掉,利用ack機制保證數據未處理成功,會通知spout重新發送.需要對記錄通過msgId進行去重.也就是spout發送tuple時指定msgId, spout也掛掉: 可以將數據記錄到外部存儲,設置checkpoint。查看全部
-
Spout繼承BaseRichSpout 并包含幾個方法(聲明字段、初始化、數據讀取和輸出) Spout中 nextTuple方法:隨機讀取String sentence中的句子通_collector.emit(next)發送給下游查看全部
-
官網下載地址:storm.apache.org/downloads.html 盡量不要選src,因為壓縮包為src類型的是源碼,需要編譯。 0.9.5.zip版本下載,在current release下面。 maven是storm的項目管理工具,需要在maven官網下載maven。 Maven官網: 下載地址鏈接:archive.apache.org/dist/maven/binaries 解壓maven.把maven的目錄解壓到bin目錄里面查看全部
-
storm采用主從結構,主Nimbus和多個從Supervisor. Nimbus只負責管理性的工作. 單點問題必須保證主節點是無狀態的,重啟就能恢復,相關元數據配置信息都是存儲在zookeeper上。 Supervisor主要聽Nimbus的話管理啟動和監控worker。 worker是真正干活的進程負責數據傳輸和計算.查看全部
-
storm 作業提交運行流程查看全部
舉報
0/150
提交
取消