apache flink-无法从twitter获取数据

dm7nw8vv  于 2021-06-25  发布在  Flink
关注(0)|答案(1)|浏览(429)

我正在尝试使用ApacheFlink通过twitter流api获取一些消息。
但是,我的代码没有在输出文件中写入任何内容。我正在计算特定单词的输入数据。
请看我的例子:

import java.util.Properties

import org.apache.flink.api.scala._
import org.apache.flink.streaming.connectors.twitter._
import org.apache.flink.api.java.utils.ParameterTool
import org.apache.flink.streaming.api.scala.StreamExecutionEnvironment
import com.twitter.hbc.core.endpoint.{Location, StatusesFilterEndpoint, StreamingEndpoint}
import org.apache.flink.streaming.api.windowing.time.Time

import scala.collection.JavaConverters._

//////////////////////////////////////////////////////
// Create an Endpoint to Track our terms
class myFilterEndpoint extends TwitterSource.EndpointInitializer with Serializable {
  @Override
  def createEndpoint(): StreamingEndpoint = {
    //val chicago = new Location(new Location.Coordinate(-86.0, 41.0), new Location.Coordinate(-87.0, 42.0))
    val endpoint = new StatusesFilterEndpoint()
    //endpoint.locations(List(chicago).asJava)
    endpoint.trackTerms(List("odebrecht", "lava", "jato").asJava)
    endpoint
  }
}

object Connection {
  def main(args: Array[String]): Unit = {

    val props = new Properties()

    val params: ParameterTool = ParameterTool.fromArgs(args)
    val env = StreamExecutionEnvironment.getExecutionEnvironment

    env.getConfig.setGlobalJobParameters(params)
    env.setParallelism(params.getInt("parallelism", 1))

    props.setProperty(TwitterSource.CONSUMER_KEY, params.get("consumer-key"))
    props.setProperty(TwitterSource.CONSUMER_SECRET, params.get("consumer-key"))
    props.setProperty(TwitterSource.TOKEN, params.get("token"))
    props.setProperty(TwitterSource.TOKEN_SECRET, params.get("token-secret"))

    val source = new TwitterSource(props)
    val epInit = new myFilterEndpoint()

    source.setCustomEndpointInitializer(epInit)

    val streamSource = env.addSource(source)

    streamSource.map(s => (0, 1))
      .keyBy(0)
      .timeWindow(Time.minutes(2), Time.seconds(30))
      .sum(1)
      .map(t => t._2)
      .writeAsText(params.get("output"))

    env.execute("Twitter Count")
  }
}

关键是,我没有错误信息,我可以看到在我的 Jmeter 板。我的消息源正在向我的triggerwindow发送数据。但它不能接收任何数据:

我一次有两个问题。
第一:如果没有收到任何信息,为什么我的源代码会向triggerwindow发送字节?
第二:我的代码有什么问题,我不能从twitter获取数据吗?

bn31dyow

bn31dyow1#

应用程序源没有将实际记录发送到窗口,您可以通过查看“已发送的记录”列看到该窗口。发送的字节属于flink在任务之间不时发送的控制消息。更具体地说,是 LatencyMarker 用于测量flink作业的端到端延迟的消息。
我觉得代码不错。我甚至试过你的代码为我工作。因此,我得出结论,twitter连接凭据肯定有问题。请重新检查您是否输入了正确的凭据。

相关问题