亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

減少python中數據框的維度

減少python中數據框的維度

函數式編程 2021-07-23 15:01:20
我有數據框,包含三列。我想減少數據框的尺寸。  data = [[1, 876, 0.98],[1, 888, 0.58],[1, 976, 0.48],[1, 648, 0.98],[2, 765, 0.28], [2, 986, 0.28], [2, 765, 1.0], [2, 876, 0.45]]    sample = pd.DataFrame(data, columns=['col1','col2', 'col3'])   col1  col2  col30     1   876  0.981     1   888  0.582     1   976  0.483     1   648  0.984     2   765  0.285     2   986  0.286     2   765  1.007     2   876  0.45我希望下面是基于條件的所需輸出: 1. 對于 col1 中的每個值,應該有一行,col 4 應該是元組列表(col2, col3) 2. col4 應該只有基于值的前兩個元組第 3 列 例如,在樣本數據幀中,col2 765 出現了兩次,最終的數據幀應該取在 col3 中具有最高值和第二高的那個data = [[1, [(876, 0.98),(648, 0.98)]],[2, [(876, 0.45), (765, 1.0)]]]desired_output = pd.DataFrame(data, columns=['col1', 'col2'])   col1                        col40     1  [(876, 0.98), (648, 0.98)]1     2   [(876, 0.45), (765, 1.0)]我想存儲在元組列表中,以便我可以將它用于其他目的。這只是解決更大問題的一部分。
查看完整描述

1 回答

?
白板的微信

TA貢獻1883條經驗 獲得超3個贊

FWIW


sample = sample.sort_values(['col1', 'col3'], ascending=[True, False])

sample.groupby('col1')[['col2', 'col3']].apply(

    lambda d: [*d.head(2).itertuples(index=False)]

).reset_index(name='col4')


   col1                        col4

0     1  [(876, 0.98), (648, 0.98)]

1     2   [(765, 1.0), (876, 0.45)]

這些將被命名為元組。你可以避免這種情況name=None


sample = sample.sort_values(['col1', 'col3'], ascending=[True, False])

sample.groupby('col1')[['col2', 'col3']].apply(

    lambda d: [*d.head(2).itertuples(index=False, name=None)]

).reset_index(name='col4')


查看完整回答
反對 回復 2021-07-28
  • 1 回答
  • 0 關注
  • 266 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號