在没有流的情况下触发长时间运行的作业

bq9c1y66 于 2021-05-27 发布在 Spark

关注(0)|答案(0)|浏览(224)

我有一个连续的数据流，为此我开始研究spark结构化流。到目前为止，我已经意识到结构化流式API的一些性能含义，以及一些其他限制，例如没有多个聚合（虽然我可以存储中间结果，但这也不是非常高效的性能）。
现在，我转向不使用流式API来编写所有内容（我没有非常复杂的数据延迟到达、窗口或数据重复问题的要求），但不确定我们是否可以通过简单地使用一个spark上下文来设计应用程序，以便在一段时间内等待新数据。有没有人做过这样的事情？这样做可能会面临哪些不同的问题？

yarn apache-spark apache-spark-sql

来源：https://stackoverflow.com/questions/63119536/spark-long-running-jobs-without-streaming

暂无答案！

目前还没有任何答案，快来回答吧！

我来回答

在没有流的情况下触发长时间运行的作业

暂无答案！

相关问题

热门标签

最新问答