-
map-reduce
查看全部 -
mapreduce
查看全部 -
這是一個筆記
查看全部 -
mapreduce
查看全部 -
數據經過Map端輸入后會進行網絡混寫,經過Shuffle后進入Reduce,在大數據量的情況下可能會造成巨大的網絡開銷。故可以在本地先按照key先行一輪排序與合并,再進行網絡混洗,這個過程就是Combine。
查看全部 -
多維向量的余弦相似度:
查看全部 -
HDFS架構圖
DataNode:數據節點,作用(存放文件和文件的副本,最小存儲單元是塊(Block) 64MB)
NameNode:名稱節點,存放的數據分2個部分,1個是塊信息,起到地址映射的作用,能讓NameNode快速定位到某個文件的位置
Secondary NameNode:輔助名稱節點;在NameNode運行時,輔助名稱節點會通過鏡像文件和變更日志,備份NameNode原數據,若NameNode掛了,可通過Secondary NameNode備份的原數據進行恢復
查看全部 -
HDFS。
查看全部 -
基于內容的推薦算法
步驟:
查看全部 -
基于內容的推薦算法
算法思想:給用戶推薦和他們之前喜歡的物品在內容上相似的其他物品
查看全部 -
基于用戶的協同過濾推薦算法
步驟:
查看全部 -
基于用戶的協同過濾推薦算法
算法思想:給用戶推薦和他興趣相似的其他用戶喜歡的物品
查看全部 -
基于物品的推薦算法
Map Reduce步驟:
查看全部 -
基于物品的協同過濾推薦算法
步驟:
1、根據用戶行為列表計算用戶、物品的評分矩陣
2、根據用戶、物品的評分矩陣計算物品與物品的相似度矩陣
3、相似度矩陣 x 評分矩陣 = 推薦列表
4、將推薦列表與評分矩陣進行比較,在推薦列表中置零已經評過分的物品,剩下的數據就是要給客戶推薦結果
查看全部 -
基于物品的協同過濾推薦算法
算法思想:給用戶推薦那些和他們之前喜歡的物品相似的物品
查看全部
舉報