亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

如何使用熊貓獲取數據框列(具有字符串數組)中每個元素的頻率?

如何使用熊貓獲取數據框列(具有字符串數組)中每個元素的頻率?

心有法竹 2022-07-12 18:06:08
我在python中有一個熊貓數據框,如下所示:df['column'] = [abc, mno]               [mno, pqr]               [abc, mno]               [mno, pqr]我想得到下面每個項目的計數:abc = 2, mno= 4 ,pqr = 2我可以對每一行進行迭代以計數,但這不是我正在尋找的那種解決方案。如果有任何方法可以使用 iloc 或與之相關的任何東西,請向我提出建議。我查看了具有類似問題的各種解決方案,但沒有一個滿足我的方案。
查看完整描述

2 回答

?
RISEBY

TA貢獻1856條經驗 獲得超5個贊

這是我如何使用它來解決它.explode(),.value_counts()您還可以將其分配為一列或隨心所欲地使用輸出:在一行中:


print(df.explode('column')['column'].value_counts())

完整示例:


import pandas as pd

data_1 = {'index':[0,1,2,3],'column':[['abc','mno'],['mno','pqr'],['abc','mno'],['mno','pqr']]}

df = pd.DataFrame(data_1)

df = df.set_index('index')

print(df)

           column

index            

0      [abc, mno]

1      [mno, pqr]

2      [abc, mno]

3      [mno, pqr]

在這里,我們執行.explode()從列表中創建單個值和 value_counts() 來計算唯一值的重復:


df_new = df.explode('column')

print(df_new['column'].value_counts())

輸出:


mno    4

abc    2

pqr    2


查看完整回答
反對 回復 2022-07-12
?
鳳凰求蠱

TA貢獻1825條經驗 獲得超4個贊

利用collections.Counter


from collections import Counter

from itertools import chain


Counter(chain.from_iterable(df.column))


Out[196]: Counter({'abc': 2, 'mno': 4, 'pqr': 2})

%時間


df1 = pd.concat([df]*10000, ignore_index=True)


In [227]: %timeit pd.Series(Counter(chain.from_iterable(df1.column)))

14.3 ms ± 279 μs per loop (mean ± std. dev. of 7 runs, 100 loops each)


In [228]: %timeit df1.column.explode().value_counts()

127 ms ± 3.06 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)


查看完整回答
反對 回復 2022-07-12
  • 2 回答
  • 0 關注
  • 120 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號