亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定

走進大數據之storm流式計算基礎

acmol 其它
難度初級
時長 1小時11分
學習人數
綜合評分8.93
47人評價 查看評價
9.0 內容實用
8.6 簡潔易懂
9.2 邏輯清晰
  • storm.apache.org/downloads.html
    查看全部
    0 采集 收起 來源:Storm的搭建

    2016-12-23

  • Nimbus掛掉,換臺機器重啟就可 supervisor掛掉,將上面的worker遷移走就可以 worker掛掉,利用ack機制保證數據未處理成功,會通知spout重新發送.需要對記錄通過msgId進行去重.也就是spout發送tuple時指定msgId, spout也掛掉: 可以將數據記錄到外部存儲,設置checkpoint。
    查看全部
    1 采集 收起 來源:數據可靠性

    2016-12-21

  • spout分組發送,有很多grouping方式(隨機,按字段分組)
    查看全部
  • strom: kafka-->數據源結點spout多個(數據來源,發送一個個Tuple給到bolt,同樣的Tuple會發到同樣的bolt),普通計算結點bolt(可調用其它語言腳本,如java,python)多個(計算完可以持久化到數據庫),數據流stream,記錄Tuple。 Hdfs: Mapper從hdfs中讀取數據并計算,進行整理后(同一個word一定落到同一個reduce里)發送給reduce-再發送給hdfs
    查看全部
  • storm作業提交運行流程 1.用戶編寫storm Topolgy(wordCountTopology) 一個用戶作業 2.使用client提交Topolgy給nimbus 3.nimbus提派Task給supervisor 4.supervisor為task啟動worker 5.worker執行task
    查看全部
    1 采集 收起 來源:Storm組件

    2016-12-21

  • storm采用主從結構,主Nimbus和多個從Supervisor,Nimbus只負責管理性的工作單點問題必須保證主節點是無狀態的,重啟就能恢復,相關元數據配置信息都是存儲在zookeeper上。Supervisor主要聽Nimbus的話管理啟動和監控worker, worker是真正干活的進程負責數據傳輸和計算.
    查看全部
    0 采集 收起 來源:Storm組件

    2016-12-21

  • 1.分清流式計算(實效要求高的場景)與批量計算(實效要求不高的場景)各自的適用場景 2.知道流式計算中時效性和正確性的取舍 GFS,bigTable,Mapreduce只適合解決批量計算的場景,只能先收集數據收集得足夠多之后,再進行Mapreduce處理,處理完后結束計算。 搜索引警惡意點擊分析,需要實時知道點擊是否是惡意點擊.以減少損失. apache storm流式數據則是數據持續不斷到來,一般做為一個服務持續不斷運行. 流式計算與批量計算整合開源框架(summint bird(trite),cloud data flow(谷歌))
    查看全部
    0 采集 收起 來源:strom概述

    2016-12-21

  • 兩種計算的區別
    查看全部
    0 采集 收起 來源:Storm起源_2

    2016-12-17

  • 批量計算與流式計算的區別
    查看全部
    0 采集 收起 來源:Storm起源_2

    2016-12-17

  • 批量式計算和流量是計算的區別
    查看全部
    0 采集 收起 來源:Storm起源_2

    2016-10-23

  • 批量計算與流式計算的區別
    查看全部
    0 采集 收起 來源:Storm起源_2

    2016-10-08

  • hadoop生態
    查看全部
    0 采集 收起 來源:分布式起源

    2016-10-08

  • 官網下載地址:storm.apache.org/downloads.html 盡量不要選src,因為壓縮包為src類型的是源碼,需要編譯。 0.9.5.zip版本下載,在current release下面。 maven是storm的項目管理工具,需要在maven官網下載maven。 Maven官網: 下載地址鏈接:archive.apache.org/dist/maven/binaries 解壓maven.把maven的目錄解壓到bin目錄里面。
    查看全部
    0 采集 收起 來源:Storm的搭建

    2016-08-28

  • Google發明的幾篇論文解決了各個公司升級服務器的弊端, 分布式框架三篇論文; google file system bigTable MapReduce 流式計算和批量計算: 目前有些人希望通過同一API解決批量計算和流式計算: Summer bird Clouddataflow (ps:此API開源)
    查看全部
    0 采集 收起 來源:Storm起源_2

    2016-08-28

  • mvn exec:java "-Dstorm.topology=storm.starter.WordCountTopology"
    查看全部
    0 采集 收起 來源:Storm IDE的搭建

    2018-03-22

舉報

0/150
提交
取消
課程須知
本課程是Storm初級課程,對用戶要求不多,但: 1.講解API時使用的是Java API,需要用戶掌握Java基本語法。 2.最好用過hadoop,或者其它分布式批處理計算系統,會更容易理解一些東西。
老師告訴你能學到什么?
1、流式計算起源 2、Storm組成與基本原理 3、Storm基本API用法 4、Storm集群搭建

微信掃碼,參與3人拼團

微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號

友情提示:

您好,此課程屬于遷移課程,您已購買該課程,無需重復購買,感謝您對慕課網的支持!