亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

如何使用 kafka 流以塊/批次的形式處理數據?

如何使用 kafka 流以塊/批次的形式處理數據?

元芳怎么了 2021-09-26 14:30:55
對于大數據中的許多情況,最好一次處理一小塊記錄緩沖區,而不是一次處理一條記錄。自然的例子是調用一些支持批處理以提高效率的外部 API。我們如何在 Kafka Streams 中做到這一點?我在 API 中找不到任何看起來像我想要的東西。到目前為止,我有:builder.stream[String, String]("my-input-topic").mapValues(externalApiCall).to("my-output-topic")我想要的是:builder.stream[String, String]("my-input-topic").batched(chunkSize = 2000).map(externalBatchedApiCall).to("my-output-topic")在 Scala 和 Akka Streams 中,該函數被稱為groupedor batch。在 Spark Structured Streaming 中,我們可以做到mapPartitions.map(_.grouped(2000).map(externalBatchedApiCall))。
查看完整描述

2 回答

  • 2 回答
  • 0 關注
  • 224 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號