我一直在搜索,但找不到我的問題的答案。我有太陽能電池測量數據。數據有時間戳值但沒有頻率。一小時內的值數量不是恒定的。一個小時內可以出現任意數量的值。所以我正在努力創造:一世。包含數據的每小時平均值的列。ii. 另一列保存每小時發生的測量計數。這很重要,因為我的時間戳沒有固定頻率。因此,重要的是要知道為一天中的特定小時計算的平均值是否有 1 次、2 次或 14 次測量。我的數據框圖像:我的代碼:yr=df.index.yearmon=df.index.monthday= df.index.dayhr = df.index.hourdf.groupby([yr, mon, day, hr])['KP_sensor'].mean()我如何在此數據幀的末尾添加兩列(平均列和該小時內發生的測量計數)。
2 回答

達令說
TA貢獻1821條經驗 獲得超6個贊
這是許多可能的解決方案之一。你已經完成了一部分。
df["hour"] = df.index.hour
df["date"] = df.index.date
dfMeans = df.groupby(["date", "hour"])[["Sol_Data", "Irr_Unc_perc", "ISF_stable", "KP_sensor", "Tamb"]].mean()
dfMeans.reset_index(inplace=True)
dfHours = pd.DataFrame(df.groupby(["date", "hour"])["hour"].count())
dfHours.columns = ["count"]
dfHours.reset_index(inplace=True)
dfFinal = pd.merge(dfHours, dfMeans, how="left", on=["date","hour"])
添加回答
舉報
0/150
提交
取消