亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

如何在整個 DataFrame 上做 pd.Series.str.count() 的等效?

如何在整個 DataFrame 上做 pd.Series.str.count() 的等效?

慕容森 2021-11-16 09:56:43
目標:計算原告和被告的數量,但不計算反被告或反原告的數量。不要計算 NaN。假設 ~200 行和最多 100 列的名稱類似于下面的示例。數據:    cl_parties_1_name   cl_parties_1_party_types_0_name   cl_parties_1_party_types_10_name  cl_parties_1_party_types_12_name    cl_parties_1_party_types_1_name   cl_parties_1_party_types_2_name0   Jason Boyd          NaN                               Counter Defendant                  NaN                                Plaintiff                         NaN1   Roberto Santana     Plaintiff                         NaN                                NaN                                NaN                               Counter Defendant2   Raymond Satterfield Counter Defendant                 NaN                                NaN                                Plaintiff                         NaN期望的輸出:Plaintiffs = 3Defendants = 0背景故事:我有一堆嵌套的 JSON,它是從 API 分頁傳遞的。我已經取消嵌套并將頁面附加在一起。這給我留下了 100 行和可能的幾十列。編輯:我知道這已經被問過幾次關于 Serieses 的問題,但我找不到整個 Dataframe 或者如何以半有效的方式在所有列上找到它。我需要查看這些 ~100x~200 DataFrames 中的大約 10,000 個。
查看完整描述

1 回答

?
ABOUTYOU

TA貢獻1812條經驗 獲得超5個贊

您可以檢查每個單元格中的確切字符串并在軸 0 和 1 上求和。


df.eq('Plaintiff').sum().sum()

使用 Numpy sum 會更有效,


np.sum(df.eq('Plaintiff').values)


3


np.sum(df.eq('Defendants').values)


3


查看完整回答
反對 回復 2021-11-16
  • 1 回答
  • 0 關注
  • 199 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號