我有一個龐大的數據集,其中混合了數值變量和分類變量。我遇到過各種特征選擇技術,主要關注數字或分類數據,而不是它們的混合。是否有任何特征選擇技術適用于這樣的數據集?
1 回答

慕妹3242003
TA貢獻1824條經驗 獲得超6個贊
您正在尋找 Boruta 包,它最初是用 R 編寫的,但也可以在 python 中使用。Boruta 使用隨機森林對特征進行排名,但您首先必須處理特征中的所有缺失值,否則 boruta 會引發錯誤。在這里查看更多信息:
https://datascience.stackexchange.com/questions/31112/boruta-feature-selection-package
添加回答
舉報
0/150
提交
取消