亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

有沒有一種方法可以組合 Pandas 中的多個列,可以將某些列中的所有數據連接到一列中

有沒有一種方法可以組合 Pandas 中的多個列,可以將某些列中的所有數據連接到一列中

湖上湖 2023-10-06 18:34:22
我希望這個問題很清楚,但我正在研究 Zillow 房屋銷售數據,并且遇到了一個問題,即能夠將某些年份的所有月份合并到新聲明的“年份”變量。這基本上應該將包含 Jan-YY、Feb-YY、Mar-YY...等的所有數據存儲為 YY。我嘗試過 Pandas 內置的函數,例如Stack()和Pivot(),但這些似乎不起作用。如果沒有可行的方法來做到這一點,我有什么選擇?提前致謝!示例:采用 Column1 = '1/31/1996'和 Column2 = '2/28/1996' …等。和 Column12 = '12/31/1996'并組合成一個名為Y1996的新列。這比每月細分更容易分析。我的代碼:  import pandas as pd  import numpy as np  import statsmodels.api as sm  import matplotlib.pyplot as plt   %matplotlib inline  zil = pd.read_csv('zillow.csv')  df_zil = pd.DataFrame(df_zil)  df_zil.head(4)  #My attempt at merging into one  y1996 = (df_zil['1/31/1996'] + df_zil['3/31/1996'] + df_zil['4/30/1996'] + df_zil['5/31/1996'] +   df_zil['6/30/1996'] + df_zil['7/31/1996'] + df_zil['8/31/1996'] + df_zil['9/30/1996'] +   df_zil['10/31/1996'] + df_zil['11/30/1996'] + df_zil['12/31/1996'])如何通過 Excel 格式化數據的屏幕截圖 - 從第一列開始參考 Zillow 數據: https: //www.zillow.com/research/data/
查看完整描述

1 回答

?
冉冉說

TA貢獻1877條經驗 獲得超1個贊

我認為你需要與支點相反的東西——融化。您的數據采用“寬”格式,如果將數據轉換為“高”格式,則可以更輕松地進行此匯總。獲得高格式的數據后,您可以使用 groupby 來匯總同一年內的值。

我下載了房屋庫存和銷售數據集,并編寫了一個簡短的程序來匯總同一年的所有值。

代碼:

import pandas as pd


df = pd.read_csv("Metro_invt_fs_uc_sfrcondo_smoothed_month.csv")

# Take all of the columns after the index and convert them into additional rows

df = df.melt(id_vars=["RegionID", "SizeRank", "RegionName", "RegionType", "StateName"], var_name="Date")

# Drop date, but keep year

df["Year"] = pd.to_datetime(df["Date"]).dt.year

df = df.drop("Date", axis="columns")

# Aggregate each year

df = df.groupby(["RegionID", "SizeRank", "RegionName", "RegionType", "StateName", "Year"], as_index=False).sum()

print(df)

輸出:


     RegionID  SizeRank                         RegionName RegionType StateName  Year    value

0      394304        74                          Akron, OH        Msa        OH  2017   3576.0

1      394304        74                          Akron, OH        Msa        OH  2018  42625.0

2      394304        74                          Akron, OH        Msa        OH  2019  39078.0

3      394304        74                          Akron, OH        Msa        OH  2020  21532.0

4      394308        60                         Albany, NY        Msa        NY  2017   2969.0

..        ...       ...                                ...        ...       ...   ...      ...

475    753906        75  North Port-Sarasota-Bradenton, FL        Msa        FL  2020  73953.0

476    753924        54                 Urban Honolulu, HI        Msa        HI  2017   3735.0

477    753924        54                 Urban Honolulu, HI        Msa        HI  2018  50079.0

478    753924        54                 Urban Honolulu, HI        Msa        HI  2019  57413.0

479    753924        54                 Urban Honolulu, HI        Msa        HI  2020  35522.0


[480 rows x 7 columns]


查看完整回答
反對 回復 2023-10-06
  • 1 回答
  • 0 關注
  • 117 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號