我正在从web上提取数据,将其转换成json格式,然后使用apacheflume将其存储到hadoopfs中。因此,flume在hadoop上存储数据时将其作为我们的文件。现在我想随机访问这些数据,然后对其进行文本分析或统计分析。做这件事的最佳方法是什么?
目前还没有任何答案,快来回答吧!
暂无答案!
目前还没有任何答案,快来回答吧!