-
用所有的數據進行訓練可能會適得其反,不僅模型復雜化,且準確度不一定更高
評估思想:將訓練數據和測試數據分離
判斷模型的準確率:比較預測結果和實際結果,正解的比例占到多少
from sklearn.metrics import accuracy_scoreprint(accuracy_score(y,y_pred))
查看全部 -
分類問題場景:垃圾郵件、三類或兩類以下的品種的分類
分類算法:K近鄰、邏輯回歸、決策樹、樸素貝葉斯
調用KNN模型:from sklearn.neighbors import KNeighborsclassifier
創建一個KNN模型實例knn = KNeighborsClassifier(n_neighbors=1)
模型訓練(學習):knn.fit(X,y)
模型預測:knn.predict([[1,2,3,4]])
)
查看全部 -
加載數據集:from sklearn import datasets
加載數據集中的iris:iris = datasets.load_iris()
查看全部 -
為什么不能自動保存。。。。
查看全部 -
scikit-learn?是python?專門針對機器學習的開源框架
jupyter notebook?是基于web的應用程序,可視化強,可單獨測試某個代碼塊
查看全部 -
?監督式學習:有固定結果
非監督式學習:無固定結果
查看全部 -
繪制圖表,進行數據可視化
pandas:基礎數據分析套件
scikit-learn:強大的數據分析建模庫
keras:人工神經網絡
查看全部 -
好先進查看全部
-
監督式學習
非監督式學習
強化學習
查看全部 -
python安裝
3.7.4最新版本
anaconda
Anaconda Distribution
查看全部 -
安裝python
安裝Anaconda
新建開發環境,安裝numpy,scikit-learn庫
新建開發環境conda create -n env_name?
安裝numpy庫pip(conda) install package_name
Jupyter notebook界面優化
https://github.com/dunovank/jupyter-themes
界面設置
jt -t oceans16 -f fira -fs 17 -cellw 90% -ofs 14 -dfs 14 -T
查看全部 -
Jupyter notebook
開源的web應用程序,旨在方便開發者創建和共享代碼文檔。用戶可以在里面寫代碼,運行代碼,查看結果,并在其中可視化數據
特點:
允許把代碼寫入獨立的cell中,然后單獨執行。用戶可以在測試項目時單獨測試特定代碼塊,無需從頭開始執行代碼
基于web進行交互開發,非常方便
查看全部 -
Scikit-learn
Python語言中專門針對機器學習應用而發展起來的一款開源框架(算法庫),可以實現數據預處理,分類,回歸,降維,模型選擇等常用的機器學習算法
特點:
集成了機器學習中各類成熟的算法,容易安裝和使用,樣例豐富,教程和文檔也非常詳細
不支持Python外的語言,不支持深度學習和強化學習
https://scikit-learn.org/stable/
查看全部 -
面向過程:所有的過程全部走一遍 面向對象:每一部分模塊化調用
查看全部 -
準確率? (TP+TN)/(TP+TN+FP+FN)
錯誤率 (FP+FN)/(TP+TN+FP+FN)
召回率? ? TP/(TP+FN)
特異度? ? TN/(TN+FP)
精確率? ?TP/(TP+FP)
F1分數? ? 2*精確率*召回率/(精確率+召回率)
查看全部
舉報