亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

[HIVE]中的insert into操作為什么非常慢

[HIVE]中的insert into操作為什么非常慢

拉丁的傳說 2018-07-16 15:22:41
例如如下語句 insert into table1 partition(xxx=xxx) select * from table2即使數據只有兩三條,也要2分鐘,這是為什么?
查看完整描述

1 回答

?
慕容708150

TA貢獻1831條經驗 獲得超4個贊

你可以這樣查看hive的執行計劃:

     > explain insert into t2 select value from t;
OK
Plan optimized by CBO.

Stage-3
  Stats-Aggr Operator
    Stage-0
      Move Operator
        table:{"name:":"default.t2"}
        Stage-2
          Dependency Collection{}
            Stage-1
              Map 1
              File Output Operator [FS_2]
                table:{"name:":"default.t2"}
                Select Operator [SEL_1] (rows=3 width=1)
                  Output:["_col0"]
                  TableScan [TS_0] (rows=3 width=1)
                    default@t,t,Tbl:COMPLETE,Col:NONE,Output:["value"]

Hive的執行要轉化成若干步map-reduce的過程,而且可能要在多個節點間通信,所以即便很少的數據可能也是費了半天勁才執行出來的。就是說hive是為了處理大數據的,對于小數據的處理并不是優勢。


查看完整回答
反對 回復 2018-07-25
  • 1 回答
  • 0 關注
  • 7444 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號