apachestorm允许处理存储在hdfs上的大量文件吗?知道我的目标是获得实时响应(秒或毫秒),或者apache storm只致力于流媒体处理!!谢谢您
fnatzsnv1#
storm只用于流式处理(与批处理相反),但如果我理解正确,您想从hdfs读取文件并处理它们吗?storm hdfs模块有一个喷口(拓扑数据源)。它可以做你想做的。https://github.com/apache/storm/tree/master/external/storm-hdfs#hdfs-喷口
1条答案
按热度按时间fnatzsnv1#
storm只用于流式处理(与批处理相反),但如果我理解正确,您想从hdfs读取文件并处理它们吗?
storm hdfs模块有一个喷口(拓扑数据源)。它可以做你想做的。
https://github.com/apache/storm/tree/master/external/storm-hdfs#hdfs-喷口