亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

<small id="9bhaf"><button id="9bhaf"></button></small>

已解決430363個問題，去搜搜看，總會有你想問的

如何在 Python 中的 Spark 上快速執行 groupby 和計數？

關注

首頁猿問如何在 Python 中的...

如何在 Python 中的 Spark 上快速執行 groupby 和計數？

Python

神不在的星期二 2023-05-23 10:45:48

我一直在嘗試在 Spark DataFrame 上執行 GroupBy 和 count() 很長時間但是它需要永遠處理......處理以下行大約需要 13 秒。從我的角度來看，我認為這需要太多時間，但我不知道如何減少處理時間。matched.limit(100).groupBy('Date','Period').agg(count("*").alias('cnt')).show()我正在使用以下配置在 Spark 2.4 上運行：驅動程序：2 個 vCPU 8 GB RAM 10 個執行程序：2 個 vCPU 8 GB RAM誰能給我提示如何解決這個問題？

查看完整描述

1 回答

12345678_0001

TA貢獻1802條經驗獲得超5個贊

我認為這是正確的方法?；ㄙM的時間將取決于那里有多少行。

df.groupBy('Date', 'Period').count().show(10, False)

反對回復 2023-05-23

1 回答
0 關注
133 瀏覽

關注

添加回答

舉報

0/150

提交

取消

微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號

亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

熱搜

最近搜索清空

如何在 Python 中的 Spark 上快速執行 groupby 和計數？

如何在 Python 中的 Spark 上快速執行 groupby 和計數？

1 回答

添加回答

如何在 Python 中的 Spark 上快速執行 groupby 和計數？