apacheflume使用我当前的配置获取前几年或前几个月的tweet。我想获取当前推文。我该怎么做?
tjrkku2a1#
请参阅下面的链接以获取hdfs的推特流:http://www.thecloudavenue.com/2013/03/analyse-tweets-using-flume-hadoop-and.html
ohfgkhjo2#
检查这个github项目,使用流式api分析hadoop中的实时tweet。https://github.com/cloudera/cdh-twitter-example本页还包括如何设置Flume,Hive和oozie。必须安装oozie和hive:http://www.cloudera.com/content/cloudera-content/cloudera-docs/cdh4/4.2.0/cdh4-installation-guide/cdh4-installation-guide.html
2条答案
按热度按时间tjrkku2a1#
请参阅下面的链接以获取hdfs的推特流:
http://www.thecloudavenue.com/2013/03/analyse-tweets-using-flume-hadoop-and.html
ohfgkhjo2#
检查这个github项目,使用流式api分析hadoop中的实时tweet。
https://github.com/cloudera/cdh-twitter-example
本页还包括如何设置Flume,Hive和oozie。
必须安装oozie和hive:http://www.cloudera.com/content/cloudera-content/cloudera-docs/cdh4/4.2.0/cdh4-installation-guide/cdh4-installation-guide.html