亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

Kafka kstream-kstream 加入滑動窗口內存使用量隨著時間的推移而增長,直到 OOM

Kafka kstream-kstream 加入滑動窗口內存使用量隨著時間的推移而增長,直到 OOM

眼眸繁星 2022-07-27 21:52:52
我在使用 kstream 連接時遇到問題。我所做的是從一個主題中分離出 3 種不同類型的消息到新的流中。然后用兩個創建另一個流的流進行一次內連接,最后我對新流和最后一個剩余流進行最后一次左連接。連接的窗口時間為 30 秒。這樣做是為了過濾掉一些被其他人覆蓋的消息。我在 kubernetes 上運行此應用程序,并且 pod 的磁盤空間無限增長,直到 pod 崩潰。我意識到這是因為連接將數據本地存儲在 tmp/kafka-streams 目錄中。這些目錄被稱為:KSTREAM-JOINTHIS... KSTREAM-OUTEROTHER..它存儲來自 RocksDb 的 sst 文件,并且這些文件無限增長。我的理解是,因為我使用 30 秒的窗口時間,所以這些應該在特定時間后被清除,但不是。我還將 WINDOW_STORE_CHANGE_LOG_ADDITIONAL_RETENTION_MS_CONFIG 更改為 10 分鐘,看看是否會發生變化,但事實并非如此。我需要了解如何改變這種情況。
查看完整描述

1 回答

?
ITMISS

TA貢獻1871條經驗 獲得超8個贊

窗口大小不會決定您的存儲要求,而是連接的寬限期。為了處理亂序記錄,數據的存儲時間比窗口大小要長。在較新的版本中,需要始終通過JoinWindows. ofTimeDifferenceAndGrace(...)JoinWindows.of(...).grace(...)在舊版本中,您可以通過-- 如果未設置,則默認為 24 小時來設置寬限期。

配置WINDOW_STORE_CHANGE_LOG_ADDITIONAL_RETENTION_MS_CONFIG配置數據在集群中存儲多長時間。因此,您可能也想減少它,但它無助于減少客戶端存儲需求。


查看完整回答
反對 回復 2022-07-27
  • 1 回答
  • 0 關注
  • 171 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號