我在cloudera生态系统中工作,作为一个初学者,我从实现flume twitter示例开始,并成功地完成了它。现在,每当我想从twitter流式传输不同关键字的数据时,我必须进入twitter的配置文件并编辑它,然后使用终端执行flume代理。
我在想一种方法,让用户打开一个表单并在其中输入关键字,然后执行flume代理从twitter获取数据,而不是每次都转到twitter配置文件。为此,我想知道cloudera生态系统中是否有任何工具来实现我上面讨论的想法?
我在cloudera生态系统中工作,作为一个初学者,我从实现flume twitter示例开始,并成功地完成了它。现在,每当我想从twitter流式传输不同关键字的数据时,我必须进入twitter的配置文件并编辑它,然后使用终端执行flume代理。
我在想一种方法,让用户打开一个表单并在其中输入关键字,然后执行flume代理从twitter获取数据,而不是每次都转到twitter配置文件。为此,我想知道cloudera生态系统中是否有任何工具来实现我上面讨论的想法?
1条答案
按热度按时间mzaanser1#
clouderamanager是唯一允许flume代理配置的接口,afaik。
否则,您将不得不创建自己的ui来完成如此具体的任务。
如果可能,您可以通过名为streamsets的包安装一个单独的工具,streamsets是一个更完整、更可编程的流媒体工具,由flume的一些人开发。