2 回答

TA貢獻1869條經驗 獲得超4個贊
根據如何處理經驗、環境或者任何我們稱之為輸入的數據,算法分為不同種類。機器學習和人工智能課本通常先考慮算法可以適應的學習方式。
這里只討論幾個主要的學習風格或學習模型,并且有幾個基本的例子。這種分類或者組織的方法很好,因為它迫使你去思考輸入數據的角色和模型準備的過程,然后選擇一個最適合你的問題的算法,從而得到最佳的結果。
監督學習:輸入數據被稱為訓練數據,并且有已知的結果或被標記。比如說一封郵件是否是垃圾郵件,或者說一段時間內的股價。模型做出預測,如果錯了就會被修正,這個過程一直持續到對于訓練數據它能夠達到一定的正確標準。問題例子包括分類和回歸問題,算法例子包括邏輯回歸和反向神經網絡。
無監督學習:輸入數據沒有被標記,也沒有確定的結果。模型對數據的結構和數值進行歸納。問題例子包括Association rule learning和聚類問題,算法例子包括 Apriori 算法和K-均值算法。
半監督學習:輸入數據是被標記的和不被標記的數據的混合,有一些預測問題但是模型也必須學習數據的結構和組成。問題例子包括分類和回歸問題,算法例子基本上是無監督學習算法的延伸。
增強學習:輸入數據可以刺激模型并且使模型做出反應。反饋不僅從監督學習的學習過程中得到,還從環境中的獎勵或懲罰中得到。問題例子是機器人控制,算法例子包括Q-learning以及Temporal difference learning。
當整合數據模擬商業決策時,大多數會用到監督學習和無監督學習的方法。當下一個熱門話題是半監督學習,比如圖像分類問題,這中問題中有一個大的數據庫,但是只有一小部分圖片做了標記。增強學習多半還是用在機器人控制和其他控制系統的開發上。
- 2 回答
- 0 關注
- 938 瀏覽
添加回答
舉報