我一直在使用flume将json文件流式传输到hadoop数据库。现在我的问题是如何从json文件中获取tweet的内容。
json文件位于“/user/flume/tweets/2013/07/14/06”中。具体来说,在这个文件夹中有10个文件。
我试着做: tweets=from.dfs("/user/flume/tweets/2013/07/14/06")
.
然后在执行 lenght(tweets)
我只看到2个。
这样做对吗?请帮帮我。
我的最终目标是在推特流到hdfs时对推特进行情绪分析。
暂无答案!
目前还没有任何答案,快来回答吧!