为了从pubmeddataset[ncbi]检索数据,我使用fireftp插件(在firefox中)检索xml、pdf和txt内容[http://www.ncbi.nlm.nih.gov/pmc/tools/ftp/]我已经成功安装了apacheflume。主要目标是——我需要将ftp与flume连接起来,并将最终结果数据集存储在cassandra中。谁能帮我把ftp源和flume连接起来吗。事先非常感谢。
50pmv0ei1#
为此,请使用flume ftp源。你可以从下面的链接下载源代码https://github.com/keedio/flume-ftp-source这是一个maven项目,所以您需要构建一个jar来使用它。
1条答案
按热度按时间50pmv0ei1#
为此,请使用flume ftp源。你可以从下面的链接下载源代码
https://github.com/keedio/flume-ftp-source
这是一个maven项目,所以您需要构建一个jar来使用它。