我使用众多指南中的一个,通过flume将twitters流式api中的数据流传输到hdfs中。我需要在数据流的某个地方添加匹配的关键字,这样我就可以看到哪个关键字生成了哪个tweet。有人能推荐一种方法吗?
kuuvgm7e1#
你可以使用拦截器。flume允许您检查事件并添加额外的数据作为标题或扩充现有事件。
1条答案
按热度按时间kuuvgm7e1#
你可以使用拦截器。flume允许您检查事件并添加额外的数据作为标题或扩充现有事件。