我有一個具有dtype=object,即類別變量的數據框,我想為其提供每個級別的計數。我希望結果是所有分類變量的漂亮摘要。為了實現上述目標,我嘗試了以下方法:(第1行)獲取所有對象類型變量的名稱(第2行)計算每個級別(a,b共個v1)的觀察次數(第3行)重命名該列,使其顯示為“ count”stringCol = list(df.select_dtypes(include=['object'])) # list object of categorical variablesa = df.groupby(stringCol[0]).agg({stringCol[0]: 'count'})a = a.rename(index=str, columns={stringCol[0]: 'count'}); a countv1 a 1279b 2382我不確定如何在打印所有字符串列計數的情況下優雅地獲得以下結果。像這樣(僅v1和v4示出,但是應該能夠打印這樣的結果的列的數目可變): count countv1 v4a 1279 l 32b 2382 u 3055 y 549我可以想到的方式是:選擇一個元素 stringCol計算每組列的計數。將結果存儲在Pandas數據框中。將熊貓數據框存儲在一個對象中(列表?)重復如果的最后一個元素stringCol完成,則中斷。但是肯定有比這更好的方法,只是不確定如何去做。
添加回答
舉報
0/150
提交
取消
