我有一个Spark流应用程序,是运行在电子病历。应用程序只需从kafka读取数据并写入s3。音量很大。我们讨论的是每批数据的gbs。我的批触发间隔是30秒。也就是说,我的批处理速度更快(执行时间不到30秒),只是每10个批处理有一分钟到2分钟的暂停。当我查看sql选项卡时,每10个批执行>1分钟。我正在使用emropimized committer来编写s3。有什么意见吗?
目前还没有任何答案,快来回答吧!
暂无答案!
目前还没有任何答案,快来回答吧!