hadoop 使用apache flume获取Twitter流数据错误

yizd12fk  于 2022-11-21  发布在  Hadoop
关注(0)|答案(1)|浏览(206)

我正在处理一个与Hadoop和Flume相关的小任务。我尝试使用Flume获取Twitter数据,但出现以下错误
错误节点。抽象配置提供程序:由于配置java.lang时出错,接收器HDFS已被删除。定义的接收器和通道设置不兼容。接收器的批处理大小大于通道的事务处理容量。接收器:HDFS,批处理大小= 1000,通道MemChannel,事务处理容量= 100

Flume_推特.conf

  1. TwitterAgent.sources = Twitter
  2. TwitterAgent.channels = MemChannel
  3. TwitterAgent.sinks = HDFS
  4. TwitterAgent.sources.Twitter.type = org.apache.flume.source.twitter.TwitterSource
  5. TwitterAgent.sources.Twitter.channels = MemChannel
  6. TwitterAgent.sources.Twitter.consumerKey = XXXXXXXXX
  7. TwitterAgent.sources.Twitter.consumerSecret = XXXXXXXXXX
  8. TwitterAgent.sources.Twitter.accessToken = XXXXXXXXXXXXXXX
  9. TwitterAgent.sources.Twitter.accessTokenSecret = XXXXXXXXXXXXX
  10. TwitterAgent.sources.Twitter.keywords = RioCompetition, cpfc, Palace, London, Christmas, New Years
  11. TwitterAgent.sinks.HDFS.type = hdfs
  12. TwitterAgent.sinks.HDFS.hdfs.path = hdfs://localhost:9000/TwitterData
  13. TwitterAgent.sinks.HDFS.hdfs.fileType = DataStream
  14. TwitterAgent.sinks.HDFS.hdfs.writeFormat = Text
  15. TwitterAgent.sinks.HDFS.hdfs.batchSize = 100
  16. TwitterAgent.sinks.HDFS.hdfs.rollSize = 0
  17. TwitterAgent.sinks.HDFS.hdfs.rollCount = 1000
  18. # Describing/Configuring the channel
  19. TwitterAgent.channels.MemChannel.type = memory
  20. TwitterAgent.channels.MemChannel.capacity = 100
  21. TwitterAgent.channels.MemChannel.transactionCapacity = 100
  22. # Binding the source and sink to the channel
  23. TwitterAgent.sources.Twitter.channels = MemChannel
  24. TwitterAgent.sinks.HDFS.channel = MemChannel

Flume环境sh

  1. export JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64
  2. export JAVA_OPTS="-Xms100m -Xmx2000m -Dcom.sun.management.jmxremote"
  3. FLUME_CLASSPATH=/home/mauli/Downloads/flume-sources-1.0-SNAPSHOT.jar

下面的命令用于运行文件
如果您有任何问题,请与我们联系。如果您有问题,请与我们联系。
我还尝试使用以下命令
/conf/flume_twitter.conf文件中的文件名和文件名。
我尝试了很多方法,几乎所有的引用都是堆栈溢出
请帮助我解决此错误
提前感谢!!!

相关问题