emr上的spark流写入s3

agyaoht7  于 2021-05-27  发布在  Spark
关注(0)|答案(0)|浏览(369)

我有一个Spark流应用程序,是运行在电子病历。应用程序只需从kafka读取数据并写入s3。音量很大。我们讨论的是每批数据的gbs。我的批触发间隔是30秒。
也就是说,我的批处理速度更快(执行时间不到30秒),只是每10个批处理有一分钟到2分钟的暂停。当我查看sql选项卡时,每10个批执行>1分钟。

我正在使用emropimized committer来编写s3。有什么意见吗?

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题