亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

應用隨機森林后提取重要特征進行訓練和測試

應用隨機森林后提取重要特征進行訓練和測試

慕哥9229398 2021-04-06 13:15:45
我正在使用隨機森林進行特征選擇(拳頭100個最重要的特征)。這是我正在使用的代碼;RandomForest_model = RandomForestRegressor(n_estimators=300,n_jobs=-1)    RandomForest_model.fit(train_x,train_y)    RandomForest_model.score(train_x,train_y)    indices = RandomForest_model.feature_importances_.argsort()[:100]    train_100_x= train.iloc[:,indices]    test_100_y = test_100_y.iloc[:,indices]我的問題是火車和測試列不匹配??磮D片:培訓和測試中第一列的圖片:我是在做錯事還是做事更有效?
查看完整描述

1 回答

?
開滿天機

TA貢獻1786條經驗 獲得超13個贊

嘗試使用列名而不是索引將子集設置為新的訓練和測試數據集


RandomForest_model = RandomForestRegressor(n_estimators=300,n_jobs=-1)

RandomForest_model.fit(train_x,train_y)


importance_df=pd.DataFrame({'feature':train_x.columns, 'importance':RandomForest_model.feature_importances_})

#sort feature importance data frame

importance_df.sort_values('importance', ascending=False, inplace=True)

#select 100 most important features

features= importance_df.feature[:100]

#

train_100_x= train_x.loc[:,features]

test_100_x = test_x.loc[:,features]


查看完整回答
反對 回復 2021-04-27
  • 1 回答
  • 0 關注
  • 314 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號