已解決430363個問題，去搜搜看，總會有你想問的

如何使用 kafka 流以塊/批次的形式處理數據？

首頁猿問如何使用 kafka...

如何使用 kafka 流以塊/批次的形式處理數據？

Python

元芳怎么了 2021-09-26 14:30:55

對于大數據中的許多情況，最好一次處理一小塊記錄緩沖區，而不是一次處理一條記錄。自然的例子是調用一些支持批處理以提高效率的外部 API。我們如何在 Kafka Streams 中做到這一點？我在 API 中找不到任何看起來像我想要的東西。到目前為止，我有：builder.stream[String, String]("my-input-topic").mapValues(externalApiCall).to("my-output-topic")我想要的是：builder.stream[String, String]("my-input-topic").batched(chunkSize = 2000).map(externalBatchedApiCall).to("my-output-topic")在 Scala 和 Akka Streams 中，該函數被稱為groupedor batch。在 Spark Structured Streaming 中，我們可以做到mapPartitions.map(_.grouped(2000).map(externalBatchedApiCall))。

查看完整描述

2 回答

2 回答
0 關注
224 瀏覽

關注

添加回答

舉報

0/150

提交

取消

亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

熱搜

最近搜索清空

如何使用 kafka 流以塊/批次的形式處理數據？

如何使用 kafka 流以塊/批次的形式處理數據？

2 回答

添加回答

如何使用 kafka 流以塊/批次的形式處理數據？

如何使用 kafka 流以塊/批次的形式處理數據？