java—处理hdfs数据的kafka使用者应该在哪里运行？

6vl6ewon 于 2021-06-02 发布在 Hadoop

关注(0)|答案(1)|浏览(383)

我对hadoop和kafka还不熟悉。我继承了kafka消费者的代码，该消费者在桌面windows机器上运行，接收远程集群上可用的新xml数据的hdfs位置，下载数据进行处理，并将结果写回hdfs集群。
在我看来，消费者应该在集群上运行，因为数据就在集群上，但我看到的所有示例kafka消费者代码都表明生产者/消费者在常规桌面机器上运行。Kafka消费者的典型目标平台是什么？

Java hadoop apache-kafka

来源：https://stackoverflow.com/questions/35784005/where-should-a-kafka-consumer-that-processes-hdfs-data-run

1条答案

按热度按时间

生产者和消费者可以在任何地方经营。您看到的示例暗示了桌面执行，因为该代码比在storm拓扑中运行的代码简单得多，而且示例往往过于简单。桌面环境的唯一原因是应用程序的ui。
如果应用程序是无头的，那么将执行移到尽可能接近数据（kafka和hdfs）的位置是非常有意义的。

赞(0）回复(0）举报 2021-06-02

相关问题

热门标签

Java query python Node 开发语言 request Util 数据库 Table 后端算法 Logger Message Element Parser

最新问答

xxl-job 安全组扫描到执行器端口服务存在信息泄露漏洞
回答(1) 发布于 4个月前
xxl-job 不能和nacos兼容？
回答(3) 发布于 4个月前
xxl-job 任务执行完后无法结束，日志一直转圈
回答(3) 发布于 4个月前
xxl-job-admin页面上查看调度日志样式问题
回答(1) 发布于 4个月前
xxl-job 参数512字符限制能否去掉
回答(1) 发布于 4个月前