我正在嘗試使用 ADASYN 庫來平衡我高度不平衡的數據。在我平衡我的數據之后,我必須將特征和目標標簽 numpy 數組加入到一個數據框中。這是我用于平衡數據的 Python 代碼:from imblearn.over_sampling import ADASYNada = ADASYN()# X is feature set and y is the labelX_resampled, y_resampled = ada.fit_sample(X, y)# Add X_resampled, y_resampled into one dataframe我該怎么做?
1 回答

侃侃爾雅
TA貢獻1801條經驗 獲得超16個贊
X_resampled
并且y_resampled
是 numpy 數組,因此我們需要np.hstack
(水平堆疊)它們在解決方案中。
X_resampled
是二維的,但是y_resampled
是一維的。之前np.hstack
,我們需要重塑y_resampled
為一列的二維數組。
全部一起:
df = pd.DataFrame(np.hstack((X_resampled, y_resampled.reshape(-1, 1))))
添加回答
舉報
0/150
提交
取消