-
先有一個業務需求,然后是數據收集,最后是特征工程,特征工程工作量大概占70%(數據轉換和數據清洗),相對于算法提升更容易提高最后成果的質量
查看全部 -
機器學習:數據質量決定結果,不同算法不會造成太大的偏差,目標用戶是個體客戶。
數據分析:數據分析師的能力及經驗決定質量,目標用戶是公司高層。
查看全部 -
什么是機器學習查看全部
-
常見算法一覽
查看全部 -
常見算法列表
查看全部 -
在線機器學習
查看全部 -
特征工程:將文字文本圖片轉化為向量形式
特征工程轉化之后,做聚類
查看全部 -
數據挖掘:關聯規則(關聯算法)
案例:啤酒+紙尿褲
查看全部 -
1. 機器學習的典型應用
????關聯規則(啤酒+尿片)
????聚類(全球通,動感地帶,神州行)
????樸素貝葉斯(垃圾郵件)
????決策樹(信用卡欺詐)
????CTR 預估(互聯網廣告)
????協同過濾(推薦系統)
????自然語言處理(情感分析,實體識別)
????圖像識別(深度學習)
????更多應用……
2. 數據分析和機器學習的區別
(1) 從數據角度
交易數據 vs 行為數據
? 交易數據:銀行存取款賬單;電商用戶訂單;電信運營商花費賬單
? 行為數據:搜索歷史,點擊歷史,瀏覽歷史,評論……
少量數據 vs 海量數據
采樣分析 vs 全量分析
(2) 從解決業務問題角度
報告過去的事情 vs 預測未來的事情
(3) 從技術手段角度
? 用戶驅動,交互式分析 vs 數據驅動,自動進行知識發現
(4) 從參與者角度
? 分析師 vs 數據+算法
3. 機器學習算法分類
分類一
監督學習:分類算法(Y類:垃圾郵件,Y值已知;X類:正常郵件),回歸算法
無監督學習:聚類(Y值未知)
半監督學習:小孩子學走路(Y值逐漸強化)
分類二:
分類與回歸
聚類
標注:我在 努力地(副詞)學習(動詞)《機器學習》(名詞)
分類三(重要):
生成模型
判別模型
查看全部 -
機器學習找規律查看全部
-
機器學習定義:
利用計算機從歷史數據鐘找出規律,并把這些規律用到對未來不確定場景的決策。
查看全部 -
分類算法同時也是回歸算法?
!!SVM算法
AdaBoost
Naive Bayes
查看全部 -
機器學習常見算法:
查看全部 -
算法分類:有沒有Y值
有監督學習:(有)訓練數據被提前打好了標簽。典型的就有分類算法和回歸算法。
無監督學習:(沒有)聚類算法。
半監督學習 :強化學習。
算法分類:根據要解決的問題進行分類。
分類與回歸
聚類
標注
算法分類:算法的本質分類。
生成模型
判別模型
查看全部 -
機器學習解決問題的框架:
訓練模型:定義模型、定義損失函數、優化算法、模型評估、效果評估
查看全部
舉報