我已将Flume源配置为spooldir类型。我有很多csv文件,.xl3和.xls,我希望我的flume代理将所有文件从spooldir加载到hdfs接收器。但是flume代理返回异常
这是我对flume源的配置:
agent.sources.s1.type = spooldir
agent.sources.s1.spoolDir = /my-directory
agent.sources.s1.basenameHeader = true
agent.sources.batchSize = 10000
我的hdfsFlume:
agent.sinks.sk1.type = hdfs
agent.sinks.sk1.hdfs.path = hdfs://...:8020/user/importflume/%Y/%m/%d/%H
agent.sinks.sk1.hdfs.filePrefix = %{basename}
agent.sinks.sk1.hdfs.rollSize = 0
agent.sinks.sk1.hdfs.rollCount = 0
agent.sinks.sk1.hdfs.useLocalTimeStamp = true
agent.sinks.sk1.hdfs.batchsize = 10000
agent.sinks.sk1.hdfs.fileType = DataStream
agent.sinks.sk1.serializer = avro_event
agent.sinks.sk1.serializer.compressionCodec = snappy
1条答案
按热度按时间z9smfwbn1#
您可以对spool dir使用以下配置。只需在下面的配置中给出本地文件系统的路径和hdfs位置。
你也可以参考这个关于flume spool dir的博客来获得更多信息。