為了執行二進制預測,我有5個特征,我想將其用于我的隨機森林分類器,其中兩個根本沒有被利用。我知道這是機器學習的全部意義,只選擇有用的特征,但其他三個特征可能有偏見的數據,我想確保我的所有特征都以相同的權重使用來運行我的分類器。我找不到這個問題的直接答案。我用在這項工作。任何意見/建議將不勝感激。sklearnpython
2 回答

幕布斯6054654
TA貢獻1876條經驗 獲得超7個贊
您可以通過設置 來請求隨機森林分類器中每個分割中正在考慮的所有特征。max_features = None
從文檔中:
max_features:整型、浮點型、字符串或無,可選(默認為“自動”)
尋找最佳拆分時要考慮的功能數量:
如果為 int,則在每次分割時考慮特征。
max_features
如果是浮點數,則為分數,并且在每次拆分時都會考慮特征。
max_features
int(max_features * n_features)
如果“自動”,則 .
max_features=sqrt(n_features)
如果為“sqrt”,則(與“自動”相同)。
max_features=sqrt(n_features)
如果為“log2”,則 .
max_features=log2(n_features)
如果為“無”,則 .
max_features=n_features
為什么使用單個樹的隨機森林比決策樹分類器好得多?中的答案可能有助于解釋和提供一些上下文。

牧羊人nacy
TA貢獻1862條經驗 獲得超7個贊
它可以幫助你的是設置參數max_feature = 1,因此每個節點將采用(均勻分布)隨機特征,并且將強制使用它。但是,您還需要設置樹的深度,因為它將無限地添加點頭,直到接收到主要特征之一。
添加回答
舉報
0/150
提交
取消