-
《集體編程智慧》
周志華的《機器學習》
查看全部 -
Python機器學習影印版,東南大學出版社
斯坦福公開課機器學習,在網易公開課上可以找到
《數據挖掘概念與技術》、《機器學習實戰》、《人工智能及其應用》、《數據庫系統概論》、《算法導論》、《Web數據挖掘》、《 Python標準庫》、《thinking in Java》、《Thinking in C++》、《數據結構》等
查看全部 -
常見算法查看全部
-
生成模型:%屬于A類,%屬于B類,%屬于C類
判別模型:屬于A/B/C類
查看全部 -
機器學習解決問題的框架:
二、訓練模型
STEP1:定義模型(形成目標公式)
STEP2:定義損失函數(數學的方式定義預測值與現實值的差異)
STEP3:優化算法(尋找確定損失函數極小值)
三、模型評估(標準)
STEP1:交叉驗證
STEP2:效果評估
查看全部 -
機器學習解決問題的框架:
一、目標的確立STEP1:確定目標(業務需求)
STEP2:收集(歷史)數據,決定項目質量高度
STEP3:特征工程(清理整合數據,提取特征)結構化,時間占比70%
查看全部 -
機器學習常見算法:
決策樹算法(有監督):解決分類、回歸問題;C4.5、kNN(不常用)
聚類:K-Means算法(無監督)
統計學習:SVM算法
關聯分析及規則:Apriori(淘汰)——需多次掃描龐大數據庫
???????????????????????????FP-Growth——僅需兩次掃描數據庫
鏈接挖掘:PageRank算法(Google)
集裝與推進:AdaBoost(人臉識別)(決策樹改進版,有監督學習)(本質上解決分類問題)
邏輯回歸:google、百度搜索結果排
推薦算法:產品推薦等
文本分析&挖掘、自然語言處理:LDA、Word2Vector、HMM、CRF
深度學習:圖像識別
查看全部 -
機器學習算法分類:
一、算法分類(1)
有監督學習
無監督學習
半監督學習
算法分類(2)(根據解決的問題類型)
???? 1、分類與回歸
? ? ?2、聚類
???? 3、標注(打標簽)
????? ? 算法分類(3)(算法本質)
? ? ? 1、生成模型(進行數據應屬類別的概率統計)
????? 2、判別模型(直接進行數據分類)
查看全部 -
二、解決業務問題不同
機器學習:預測未來事件(未來趨勢)
數據分析:報告過去事件(歷史總結)
三、技術手段、方法不同
機器學習:數據挖掘;數據(算法)驅動;規模大
數據分析:OLAP;用戶驅動(企業數據分析師的經驗等);規模小;交互式分析
缺點:受限于分析師的經驗,分類的多樣化受限制
四、參與(驅動)者不同
機器學習:數據+算法,數據質量決定結果
數據分析:數據分析師,能力&經驗決定結果
五、服務用戶不同
機器學習:個體用戶
數據分析:公司高層
查看全部 -
機器學習和數據分析的區別:
一、數據特點不同(數據類別、數據量、數據分析方法)
機器學習:行為數據(如搜索歷史、瀏覽歷史、點擊歷史、評論等);海量分析,一致性要求相對不高;全量分析
數據分析:交易數據(與錢相關,如用戶訂單、存取款賬單、話費賬單等)少量數據,一致性要求嚴格(如銀行存取款,數據精準);采樣分析
查看全部 -
機器學習兩種使用場景?離線學習和在線學習。
離線學習:批處理的方式,對以前的數據進行學習,從而運用到后面的指導中
在線學習:對實時產生的數據進行學習,再對實時得業務進行指導
查看全部 -
利用模型去擬合規律
查看全部 -
利用計算機從歷史數據中找出規律,并把這些規律用到對未來不確定場景得決策
例如預測天氣? 公司業績
查看全部 -
機器學習的典型應用:自然語言處理? ? ?情感分析 實體識別
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?圖像識別? 深度學習
更多應用 :? 語音識別? ?個性化醫療? 情感分析 人臉識別? 自動駕駛? 智慧型機器人? ?私人虛擬助理? 手勢控制? 視頻內容自動識別
查看全部 -
機器學習的典型應用:互聯網廣告? ?ctr預估
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?推薦系統? ? ? 協同過濾
查看全部
舉報