关闭。这个问题需要更加突出重点。它目前不接受答案。
**想改进这个问题吗?**通过编辑这篇文章更新这个问题,使它只关注一个问题。
三年前关门了。
改进这个问题
我正在用flink发现流处理的领域。然而,到目前为止,我读到的大多数专业文章都是关于Flink和Kafka的。然而,我没有找到一个明确的解释,为什么这两个似乎如此逻辑和解释Kafka做什么,Flink不能,反之亦然。
到目前为止,我发现:-flink不能用readcsvfile连续处理\u,kafka可以在这方面提供支持,-kafka可以做流聚合,但与kafka相比似乎有限(不确定)。
因此,请不要犹豫,添加您的知识和经验,您迄今为止与这些系统。事先非常感谢。
1条答案
按热度按时间yrefmtwq1#
的确,乍一看差别并不明显。
apachekafka是一种处理实时信息并将其快速路由到消费者的解决方案,这意味着它是一个消息代理。
apacheflink是一个流处理框架。它涉及内存中的数据分布式计算。
也就是说,基本上,kafka将扮演消息路由器的角色,apache flink将处理数据。
正如您在下面的示例模式中看到的,kafka允许发布来自异构源的消息,apache flink将通过应用窗口或reduce函数来处理这些数据。
如果你查阅Kafka文档,他们在Kafka的基础上引入了一个新特性,称为Kafka流(它不是原始Kafka的一部分)。这也是一个流处理框架,能够像apache flink那样处理数据。