-
HQL 解析器 編譯器 優化器
執行計劃
索引使速度變快。
查看全部 -
hive 元信息默認存儲在derby里面,包含表名稱,ID,表的存儲位置
列的ID ,名稱,以及列所在表的ID等等。
查看全部 -
Hive是基于Hadoop之上的數據倉庫。
也就是說 Hive實際就是數據庫。
Hive是數據倉庫,數據倉庫就是數據庫,Hive是構建在hadoop hdfs上的數據倉庫。
hive和一般意義上的數據庫有什么區別
如何搭建數據庫
創建的過程是什么
如何把數據導入到數據倉庫
hive的體系結構是什么
hive如何與hadoop hdfs進行相互操作
hive數據與hadoop中的文件之間的關系
查看全部 -
Hive的體系結構:
Hive的元數據:
查看全部 -
Hive的基本概念:
查看全部 -
數據倉庫:是一個面向主題的、集成的、不可更新的、隨時間不變化的數據集合,它用于支持企業或組織的決策分析處理。
OLTP應用:聯機事務處理,關注的是事物的處理,典型的OLTP應用是銀行轉賬,一般操作頻率會比較高;
OLAP應用:聯機分析處理,主要面向的是查詢,典型的OLAP應用是商品推薦系統,一般不會做刪除和更新,數據一般都是歷史數據。
數據倉庫中的數據模型:星型模型和雪花模型。星型模型是數據倉庫最基本的數據模型,雪花模型是在星型模型的基礎上發展起來的。
查看全部 -
hive -e ‘select * from table1’不進入交互模式,執行sql語句 hive -S 靜默模式,不輸出mapreduce執行細節查看全部
-
Select * 不走mapreduce ,select 列走mapreduce Source xxx.sql執行sql腳本 在hive cli下用!命令執行命令查看全部
-
dfs -is查看全部
-
安裝模式 1 嵌入模式 本地durby 2 本地模式 mysql和hive在同一臺機器 3 遠程模式 mysql和hive在不同機器查看全部
-
視圖
視圖不存數據 從視圖中查到的數據是來自于視圖所依賴的表
查看全部 -
Hive的數據模型:外部表
查看全部 -
Hive的數據模型:分區表
查看全部 -
Hive的數據模型
查看全部 -
Hive的數據存儲
基于HDFS
Hive中表沒有專門的數據存儲格式,用文本文件或者CSV文件代表表中的數據
查看全部
舉報