-
Google大數據技術: 1.MapReduce 2.BigTable 3.GFS 革命性變化 1.成本降低,能用PC機,不用大型機和高端存儲 2.軟件容錯硬件故障視為常態,通過軟件保證可靠性 3.簡化并行分布式計算,無須控制節點同步和數據交換 Hadoop:模仿Google大數據技術的開源技術查看全部
-
hadoop 的安裝: 1.準備linux環境 2.安裝jdk 3.配置hadoop Windows用戶如何獲取linux環境查看全部
-
hive(小蜜蜂)==>sql==>hadoop任務 hbase:存儲結果話數據的分布式數據,放棄事務特性,追求更高的擴展。 提供數據的隨機讀寫和實時訪問,實現對表數據的讀寫功能 zookeper:管理集群的配置,監控節點的狀態。 hadoop version 1.2 穩定 2.0 不是很穩定。查看全部
-
Hadoop:開源的分布式存儲+分布式計算 核心組成: HDFS:分布式文件系統,存儲海量數據。 MapReduce:并行處理框架,實現任務分解和調度。 優勢: - 高擴展 - 低成本 - 成熟的生態圈(因為開源)查看全部
-
mapreduce,bigtable,GFS 變化1:成本低,能用pc機,就不用大型機和高端存儲 2 軟件高可靠性 3.簡化并行分布式技術,無須控制節點同步和數據交換 一個模仿Google大數據技術的開源實現。查看全部
-
課程學習建議: 1.結合書本,知識點更加系統全面 對應的書本:hadoop技術詳解、hadoop權威指南 2.實踐經驗很重要,邊聽課邊實踐。 課程預備知識: linux常用命令 java編程基礎查看全部
-
http://mirror.bit.edu.cn/apache/common/hadooop-1.2.1/hadooop-1.2.1.tar.gz查看全部
-
復制一下 修改 /etc/profile 文件 添加如下4條 1.export JAVA_HOME=/usr/lib/jvm/java-7-openjdk-amd64 2.export JRE_HOME=$JAVA_HOME/jre 3.export CLASSPATH=.:$JAVA_HOME/lib:$JRE_HOME/lib:$CLASSPATH 4.export PATH=$JAVA_HOME/bin:$JRE_HOME/bin:$PATH 注解: 1.Linux下用冒號 : 分割路徑 2.$PATH / $JAVA_HOME / $JRE_HOME 是用來引用原來環境變量的值,在設置環境變量時不能把原來的值給覆蓋掉 3.$CLASSPATH 中 當前目錄 “.”不能丟 4.export 是把這4個變量導出為全局變量 --(摘自 博客園——SamCN) [ 收起全文 ] 2015-07-21 1 1 dddpeter 操作不算很規范,一般不使用系統自導的jdk,而且一般應用也不一股腦兒安裝在root用戶下查看全部
-
云主機查看全部
-
原理 好 如此查看全部
-
jdk配置查看全部
-
mapred-site.xml配置 <property> <name>mapred.job.tracker</name> <value>weiyt:9001</value> </property>查看全部
-
hdfs-site.xml配置 <property> <name>dfs.data.dir</name> <value>/hadoop/data</value> </property>查看全部
-
Hadoop ecosystem map查看全部
-
hive:sql->hadoop任務 hbase:存儲結構話數據的分布式數據庫。放棄事物特性,追求更高的擴展。 zookeper:管理集群的配置,監控節點的狀態查看全部
舉報
0/150
提交
取消