apacheflume中的hadoop标记匹配关键字

pkwftd7m  于 2021-06-04  发布在  Hadoop
关注(0)|答案(1)|浏览(398)

我使用众多指南中的一个,通过flume将twitters流式api中的数据流传输到hdfs中。我需要在数据流的某个地方添加匹配的关键字,这样我就可以看到哪个关键字生成了哪个tweet。有人能推荐一种方法吗?

kuuvgm7e

kuuvgm7e1#

你可以使用拦截器。flume允许您检查事件并添加额外的数据作为标题或扩充现有事件。

相关问题