亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

如何對python中數據框列中的唯一值執行函數

如何對python中數據框列中的唯一值執行函數

慕勒3428872 2022-07-05 17:14:55
我有大約 500 萬條記錄的數據,如下圖所示,我需要獲取新數據框中每個 ID 的最大值和平均值,以便每個 ID 只有一個值我對 python 和編程很陌生,這個小組很有幫助,但我似乎沒有找到這個特定問題的相關答案。謝謝
查看完整描述

1 回答

?
largeQ

TA貢獻2039條經驗 獲得超8個贊

這應該這樣做:


import numpy as np

import pandas as pd


# create dummy data

ids = [1,1,1,1,2,2,2,2,2,3,3,3,3,4,4,4,4]

values = [13,21,34,22,34,2,3,34,12,45,45,23,67,76,32,23,80]

df = pd.DataFrame({'ID': ids, 'Values': values})


df = df.groupby('ID').agg({'Values': [min, max, np.mean]})  # group by on ID and calculate new columns min, max, mean for the values columns

df.columns = df.columns.droplevel(0)  # get rid of the multilevel columns due to the grouping

df.reset_index()

編輯:感謝 ALollz 指出以下快捷方式(避免多級索引):


df = df.groupby('ID')['Values'].agg([min, max, np.mean])  # group by on ID and calculate new columns min, max, mean for the values columns

df.reset_index()

讓我知道是否有任何步驟需要詳細說明。


查看完整回答
反對 回復 2022-07-05
  • 1 回答
  • 0 關注
  • 146 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號