python中什么是測試數據和訓練數據
1 回答

楊__羊羊
TA貢獻1943條經驗 獲得超7個贊
當數據量特別大的時候,有幾千幾萬條,為了驗證模型的好壞,取出一部分用于訓練,另一部分用作測試。當模型訓練好的時候,其必定是符合訓練數據的分布,為了驗證模型的泛化能力,就利用沒有參與訓練的測試集,放入模型計算出結果,和真實值比較,就可以看出回歸模型預測得準不準了
從代碼來看你這個做的是一個簡單的線性回歸模型,數據很簡單就是研發成本對應產品質量,利用線性回歸擬合一條直線,由于你的數據特別少只有8個點,所以完全沒有必要區分訓練數據和測試數據,尤其你設置測試集比例為0.1,其實就只有一條,用處不大,所以沒有區分的必要
- 1 回答
- 0 關注
- 1165 瀏覽
添加回答
舉報
0/150
提交
取消