假設我的熊貓數據框的某些列中有元組元素,我想使用類似的方法 .describe() id 只考慮每個元組的第一個值例如我的數據框是: col1 col2 col30 6 (5,8) (4,7)1 5 (6,3) (1,2)2 8 (3,7) (3,6)當我使用這個方法時df = pd.describe(df)我希望它為每個帶有元組的列采用元組的第一個值來計算平均值和其他統計數據
1 回答

HUH函數
TA貢獻1836條經驗 獲得超4個贊
只需使用str訪問器切片并分配回第一個元素:
df.assign(**df[['col2','col3']].apply(lambda x: x.str[0])).describe()
col1 col2 col3
count 3.000000 3.000000 3.000000
mean 6.333333 4.666667 2.666667
std 1.527525 1.527525 1.527525
min 5.000000 3.000000 1.000000
25% 5.500000 4.000000 2.000000
50% 6.000000 5.000000 3.000000
75% 7.000000 5.500000 3.500000
max 8.000000 6.000000 4.000000
在哪里:
df.assign(**df[['col2','col3']].apply(lambda x: x.str[0]))
col1 col2 col3
0 6 5 4
1 5 6 1
2 8 3 3
添加回答
舉報
0/150
提交
取消