已采納回答 / Acerreca
這里混淆了兩個概念:數據倉庫的更新數據倉庫中數據的更新數據倉庫一定要更新的,因為不斷的將OLTP產生的數據通過ETL導入數據倉庫中。但是,已經導入數據倉庫中的數據,是不會更新的,換句話說,一條數據進入了數據倉庫,就不會再做任何改變。如果想要對已有的數據進行更改,只會產生新的數據,再次倒入數據倉庫。這是因為,數據倉庫是用來做決策分析的。過去的所有數據,都是代表了當時的狀態,所以不可以有任何改變。就像歷史一樣,已經成為事實的東西,是不能改變的。
2017-02-24
已采納回答 / Hadoop_hive
如果做大數據的話,應該先學Linux操作系統,再學Java,把Hadoop體系放到最后,你不學Linux你就不懂操作命令,不學Java就看不懂MR;
2016-11-12
已采納回答 / 陸克乾
每個桶里可以放很多數據的。哈希值只是分桶的依據罷了,目的是為了平均放在每個桶里。假如有26個桶,按照name的首字母放入各個桶里,這也算一種方法。但是有些比如A開頭的就比較少,S的可能就很多。如果使用一些Hash算法(比如MD5(tom)=34b7da764b21d298ef307d04d8152dc5),都變成一樣長度的字符,這樣0到F十六種字符開頭的概率是一樣的,分16個桶基本平均分配了,分2、4、6、8個桶也很簡單。實際中可以有很多種Hash算法,和分桶算法(一般按照Hash的二進制分)。
2016-10-03
已采納回答 / 花里狐邵
重點關注下面 ?1、數據倉庫簡介 2、Hive是什么? 3、Hive的體系結構 4、Hive的安裝與管理 5、Hive的數據類型 6、Hive的數據模型
2016-09-03
已采納回答 / nullundefine
我的是字符集有問題(message:For direct MetaStore DB connections, we don't support retries at the client level,改為alter database hive character set latin1
2016-06-26