-
機器學習和數據分析
查看全部 -
自然語言處理:????情感分析
????????????????????????????實體識別
圖像識別:????深度學習
查看全部 -
互聯網廣告:ctr預估
推薦系統:協同過濾
查看全部 -
垃圾郵件:樸素貝葉斯
信用卡欺詐:決策樹
查看全部 -
用戶細分精準營銷:聚類(根據消費記錄得出消費特征進行用戶分類)
查看全部 -
機器學習典型應用:
????購物籃分析:關聯規則(典型數據挖掘算法)
查看全部 -
機器學習使用場景:離線 批處理????
????????????????????????????????在線學習---電商、搜索
查看全部 -
機器學習發展
查看全部 -
機器學習:利用計算機從歷史數據中找到規律,并把這些規律用到對未來不確定場景的決策。
查看全部 -
解決問題框架
查看全部 -
機器學習
《概率論》、《數據統計》
統計學受限于運算能力的限制,
統計學依賴于采樣的數據,需要驗證結論
觀察數據:上下波動、總體上升
且模型刻畫規律, 函數-》公式
-----------------------------------------
機器學習發展的原動力:
經濟驅動,數據變現
-----
業務系統發展的歷史:
基于專家經驗
基于統計--分緯度統計
機器學習--在線學習(電商、搜索 實時學習、分析、推薦)
離線機器學習(不實時)
------
機器學習的典型應用:
購物籃分析:
算法是:關聯規則(典型的數據挖掘的算法)
用戶細分精準營銷:
聚類
垃圾郵件識別:
樸素貝爾斯
信用卡欺詐:
決策樹
互聯網廣告:
ctr預估(點擊率的預估)
推薦系統:
協同過濾。
-------
典型應用自然語言處理和圖像識別
自然語言處理:
情感分析、
實體識別
圖像識別:
深度學習
語音識別
個性化醫療、自動駕駛、智慧機器人、
機器學習無處不在
------------
機器學習和數據分析的區別
傳統:交易數據、少量數據、采樣分析
現:行為數據、海量數據、全量分析(no sql 只能處理行為數據)
區別2:
傳統:報告解決歷史事情、
現:預測未來
技術手段不同:
傳統:用戶驅動、交互式分析
現:數據驅動、自動進行知識發現
參與者不同:
數據分析:分析師
機器學習:數據+算法
目標用戶:
數據分析:公司高層
機器學習:個體
------------------
機器學習算法分類:
算法分類:
有監督學習:分類算法、回歸算法
無監督學習:聚類
半監督學習(強化學習算法):
算法分類2:
分類與回歸
聚類
標注
算法分類3:
生成模型
判別模型機器學習常見算法一覽
(大部分的人臉識別是通過 adaboost 算出來的,是決策樹的改進版。apriori基本被淘汰,FP-Growth是它的升級版,是一個美籍華人發明出來的、)
百度搜索的排序就是用的? “邏輯回歸”的算法
推薦算法:各大電商網站的標配LDA是用途文本分析的。
------
機器學習解決問題:
總的框架:(公用的思想)
確定目標
業務需求、
數據、
特征工程(投入70%)訓練模型:
定義模型、
定義損失函數、
優化算法模型評估:
交叉驗證、
效果評估查看全部 -
業務需求——>數據——>特征工程
查看全部 -
*定義損失函數
*優化算法
查看全部 -
統計學習——SVM
集裝與推進——Adaboost(人臉識別)
查看全部 -
機器學習算法分類:
第一種分類方法:有/無/半監督學習
第二種分類方法:分類與回歸/聚類/標注
第三種分類方法:生成模型/判別模型
查看全部
舉報