使用flume读取ibmq数据

p4rjhz4m 于 2021-06-02 发布在 Hadoop

关注(0)|答案(1)|浏览(572)

我想从ibmq读取数据并将其放入hdfs。
查看flume的jms源代码，它似乎可以连接到ibmq，但我不明白“destinationtype”和“destinationname”在所需属性列表中的含义。有人能解释一下吗？
另外，我应该如何配置我的flume代理
flumeagent1（在与mq相同的计算机上运行）读取mq数据---- flumeagent2（在hadoop集群上运行）写入hdfs，或者hadoop集群上只有一个代理就足够了
有人能帮助我理解mqs如何与flume集成吗
参考
https://flume.apache.org/flumeuserguide.html
谢谢，查亚

hadoop flume streaming ibm-mq

来源：https://stackoverflow.com/questions/30096172/using-flume-to-read-ibm-mq-data

1条答案

按热度按时间

5ssjco0h1#

关于flume代理体系结构，它由负责接收或轮询事件并将事件转换为放入通道中的flume事件的源以其最简形式组成。然后，接收器接收这些事件以便将数据持久化到某个地方，或者将数据发送到另一个代理。所有这些组件（源、通道、接收器，即代理）都在同一台机器上运行。不同的代理可以被分发。
话虽如此，您的场景似乎需要基于jms源、通道（通常是内存通道）和hdfs接收器的单个代理。
如文档中所述，jms源代码仅针对activemq进行了测试，但应适用于任何其他队列系统。文档还提供了一个示例：

a1.sources = r1
a1.channels = c1
a1.sources.r1.type = jms
a1.sources.r1.channels = c1
a1.sources.r1.initialContextFactory = org.apache.activemq.jndi.ActiveMQInitialContextFactory
a1.sources.r1.connectionFactory = GenericConnectionFactory
a1.sources.r1.providerURL = tcp://mqserver:61616
a1.sources.r1.destinationName = BUSINESS_DATA
a1.sources.r1.destinationType = QUEUE
``` `a1` 是单个代理的名称。 `c1` 是通道的名称，其配置必须仍然完成；而且完全没有接收器配置。可通过添加以下内容轻松完成：

a1.sinks = k1
a1.sinks.k1.type = hdfs
a1.sinks.k1.channel = c1
a1.sinks.k1.hdfs.path = ...
a1.sinks.k1...
a1.channels.c1.type = memory
a1.channels.c1.capacity = 10000
a1.channels.c1...
``` r1 是jms源代码，可以看到， destinationName 只需输入一个字符串名。 destinationType 只能取两个值： queue 或者 topic . 我认为重要的参数是 providerURL 以及 initialContextFactory 以及 connectionFactory ，它必须适用于ibm mq。

赞(0）回复(0）举报 2021-06-02

我来回答

使用flume读取ibmq数据

1条答案

相关问题

热门标签

最新问答