亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定

走進大數據之storm流式計算基礎

acmol 其它
難度初級
時長 1小時11分
學習人數
綜合評分8.93
47人評價 查看評價
9.0 內容實用
8.6 簡潔易懂
9.2 邏輯清晰
  • Grouping方式

    查看全部
  • 環境搭建:

    1.下載安裝zookeeper

    2.生成一個新的配置文件 zoo.cfg

    3.修改配置文件:vi zookeeper-3.4.6/conf/zoo.cfg

    添加以下內容:

    tickTime=2000

    dataDir=/Users/dev/zookeeper-3.4.6/data

    clientPort=2181

    4.進入zookeeper目錄: cd zookeeper-3.4.6

    5.啟動zookeeper服務: sh bin/zkServer.sh start

    6.查看運行狀態:echo stat | nc 127.0.0.1 2181


    zookeeper集群版配置:

    1.生成zoo.cfg.cluster文件,vi zoo.cfg.cluster

    內容如下:

    tickTime=2000

    dataDir=/Users/dev/zookeeper-3.4.6/data

    clientPort=2181

    server.1=xx.xx.xx.xx:2182

    server.2=xx.xx.xx.xx:2182

    server.3=xx.xx.xx.xx:2182

    syncLimit=2

    initLimit=5

    2.創建新文件 vi myid

    內容如下:

    1

    3.在每臺安裝zookeeper的機器上啟動服務即可


    啟動storm

    1.進入storm文件:cd apache-storm-0.9.5

    2.啟動storm服務:

    nohup bin/storm nimbus &

    nohup bin/storm supervisor &

    nohup bin/storm ui &

    3.訪問:http://localhost:8080/index.html

    4.集群模式下,需要更改配置文件 vi conf/storm.yaml, 修改zk配置


    提交一個jar包到storm:

    1.查看文件:ls examples/storm-starter/

    2.提交jar: ./bin/storm jar examples/storm-starter/storm-starter-topologies-0.9.5.jar storm.starter.WordCountTopology wordcount

    3.訪問http://localhost:8080/index.html 就能看到

    4.關閉命令:./bin/storm kill wordcount

    查看全部
    0 采集 收起 來源:實際搭建Storm

    2022-08-07

  • 數據可靠性:

    http://img1.sycdn.imooc.com//62ef9ee100017a5610970286.jpg

    http://img1.sycdn.imooc.com//62ef9f0600015eab09100436.jpg

    http://img1.sycdn.imooc.com//62ef9f160001a8f510710435.jpg


    http://img1.sycdn.imooc.com//62ef9f5d0001412e10020356.jpg

    http://img1.sycdn.imooc.com//62efa0d50001298908720558.jpg

    Nimbus掛掉,換臺機器重啟就可
    supervisor掛掉,將上面的worker遷移走就可以
    worker掛掉,利用ack機制保證數據未處理成功,會通知spout重新發送.需要對記錄通過msgId進行去重.也就是spout發送tuple時指定msgId,
    spout也掛掉: 可以將數據記錄到外部存儲,設置checkpoint。

    查看全部
    0 采集 收起 來源:數據可靠性

    2022-08-07

  • task數邏輯數,就是前面設置的.setNumTasks(7)<br>
    worker是進程數
    executor是表示線程數

    查看全部
  • 循環運行了100次,而且有7個并發,所有每個單詞的數量都是700的倍數

    查看全部
    0 采集 收起 來源:StormAPI使用下

    2022-08-07

  • Spout繼承BaseRichSpout 并包含幾個方法(聲明字段、初始化、數據讀取和輸出)

    Spout中 nextTuple方法:隨機讀取String sentence中的句子通過_collector.emit(next)發送給下游

    查看全部
    0 采集 收起 來源:StormAPI使用上

    2022-08-07

  • grouping:

    1. 隨機發送

    2. 按一定規則發送

    strom: kafka-->數據源結點spout多個(數據來源,發送一個個Tuple給到bolt,同樣的Tuple會發到同樣的bolt),普通計算結點bolt(可調用其它語言腳本,如java,python)多個(計算完可以持久化到數據庫),數據流stream,記錄Tuple。
    Hdfs: Mapper從hdfs中讀取數據并計算,進行整理后(同一個word一定落到同一個reduce里)發送給reduce-再發送給hdfs

    查看全部
  • $ cd apache-storm-0.9.5

    $ cd examples/storm-starter/

    $ mv test

    $ mvn exec:java "-Dstorm.topology=storm.starter.WordCountTopology"

    查看全部
    0 采集 收起 來源:Storm IDE的搭建

    2022-08-07

  • storm作業提交運行流程
    1.用戶編寫storm Topolgy(wordCountTopology) 一個用戶作業
    2.使用client提交Topolgy給nimbus
    3.nimbus提派Task給supervisor
    4.supervisor為task啟動worker
    5.worker執行task

    --------------------------

    storm采用主從結構,主Nimbus和多個從Supervisor,Nimbus只負責管理性的工作單點問題必須保證主節點是無狀態的,重啟就能恢復,相關元數據配置信息都是存儲在zookeeper上。Supervisor主要聽Nimbus的話管理啟動和監控worker, worker是真正干活的進程負責數據傳輸和計算.

    -------------------------------

    Storm 主從結構

    Nimbus 主節點,只負責整體分配工作,不具體干活
    Supervisor 從節點,維護每臺機器,直接管理干活的Worker
    Worker ?真正干活的(task)進程,數據計算和傳輸
    DRPC ?
    Storm UI 監控WEB


    運行流程
    用戶編寫作業
    使用客戶端提交給Nimbus
    Nimbus指派Task給Supervisor
    Supervisor 為task啟動Worker
    Worker 執行Task

    http://img1.sycdn.imooc.com//62ef8adf0001d73d08160557.jpg

    查看全部
    0 采集 收起 來源:Storm組件

    2022-08-07

  • Google發明的幾篇論文解決了各個公司升級服務器的弊端,
    分布式框架三篇論文;
    ? ?google file system
    ? ?bigTable
    ? ?MapReduce
    流式計算和批量計算:
    目前有些人希望通過同一API解決批量計算和流式計算:
    Summer bird
    Clouddataflow


    ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 批量計算 ? ? ? ? ? ? ? ? ? ? 流式計算
    數據到達 ? ? ? 計算開始前數據已準備好 ? ? ? ? ? 計算進行中數據持續到來
    計算周期 ? ? ? 計算完成后會結束計算 ? ? ? ? ? ? 一般會作為服務持續運行
    使用場景 ? ? ? 時效性要求低的場景 ? ? ? ? ? ? ? 時效性要求高的場景

    查看全部
    0 采集 收起 來源:Storm起源_2

    2022-08-07

  • storm走也提交運行流程

    查看全部
    0 采集 收起 來源:Storm組件

    2021-01-30

  • huh
    查看全部
    0 采集 收起 來源:strom概述

    2020-03-24

  • Storm主從結構

    查看全部
    0 采集 收起 來源:Storm組件

    2019-04-18

  • 批量計算與流式計算的區別

    查看全部
    0 采集 收起 來源:Storm起源_2

    2019-04-18

  • 我的筆記test13我的筆記test13我的筆記test13我的筆記test13我的筆記test13

    1. 我的筆記test13我的筆記test13我的筆記test13我的筆記test13我的筆記test13我的筆記test13我的筆記test13我的筆記test13我的筆記test13我的筆記test13我的筆記test13我的筆記test13

    2. 我的筆記test13我的筆記test13我的筆記test13我的筆記test13我的筆記test13我的筆記test13我的筆記test13我的筆記test13我的筆記test13我的筆記test13我的筆記test13我的筆記test13

    3. 我的筆記test13我的筆記test13我的筆記test13我的筆記test13我的筆記test13我的筆記test13我的筆記test13我的筆記test13我的筆記test13我的筆記test13我的筆記test13我的筆記test13

    我的筆記test13我的筆記test13我的筆記test13我的筆記test13我的筆記test13我的筆記test13我的筆記test13我的筆記test13我的筆記test13我的筆記test13我的筆記test13我的筆記test13我的筆記test13我的筆記test13我的筆記test13我的筆記test13我的筆記test13我的筆記test13我的筆記test13我的筆記test13我的筆記test13我的筆記test13我的筆記test13我的筆記test13我的筆記test13我的筆記test13我的筆記test13我的筆記test13我的筆記test13我的筆記test13我的筆記test13我的筆記test13我的筆記test13我的筆記test13我的筆記test13我的筆記test13我的筆記test13

    查看全部
  • 我的筆記test13

    查看全部
  • 我的筆記test12

    查看全部
  • 我的筆記test11

    查看全部
  • 我的筆記test10

    查看全部
首頁上一頁1234567下一頁尾頁

舉報

0/150
提交
取消
課程須知
本課程是Storm初級課程,對用戶要求不多,但: 1.講解API時使用的是Java API,需要用戶掌握Java基本語法。 2.最好用過hadoop,或者其它分布式批處理計算系統,會更容易理解一些東西。
老師告訴你能學到什么?
1、流式計算起源 2、Storm組成與基本原理 3、Storm基本API用法 4、Storm集群搭建

微信掃碼,參與3人拼團

微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號

友情提示:

您好,此課程屬于遷移課程,您已購買該課程,無需重復購買,感謝您對慕課網的支持!