目標:計算原告和被告的數量,但不計算反被告或反原告的數量。不要計算 NaN。假設 ~200 行和最多 100 列的名稱類似于下面的示例。數據: cl_parties_1_name cl_parties_1_party_types_0_name cl_parties_1_party_types_10_name cl_parties_1_party_types_12_name cl_parties_1_party_types_1_name cl_parties_1_party_types_2_name0 Jason Boyd NaN Counter Defendant NaN Plaintiff NaN1 Roberto Santana Plaintiff NaN NaN NaN Counter Defendant2 Raymond Satterfield Counter Defendant NaN NaN Plaintiff NaN期望的輸出:Plaintiffs = 3Defendants = 0背景故事:我有一堆嵌套的 JSON,它是從 API 分頁傳遞的。我已經取消嵌套并將頁面附加在一起。這給我留下了 100 行和可能的幾十列。編輯:我知道這已經被問過幾次關于 Serieses 的問題,但我找不到整個 Dataframe 或者如何以半有效的方式在所有列上找到它。我需要查看這些 ~100x~200 DataFrames 中的大約 10,000 個。
1 回答

ABOUTYOU
TA貢獻1812條經驗 獲得超5個贊
您可以檢查每個單元格中的確切字符串并在軸 0 和 1 上求和。
df.eq('Plaintiff').sum().sum()
使用 Numpy sum 會更有效,
np.sum(df.eq('Plaintiff').values)
3
np.sum(df.eq('Defendants').values)
3
添加回答
舉報
0/150
提交
取消