我开始使用ApacheFlink进行网络流量分析。我没有找到一种方法来总结超过一个指标使用时间窗口。在下面的示例中,代码聚合了一个单词的用法,但是如果我需要聚合单词、书籍、站点名称等怎么办(流量超过1公制)
val keyValuePair = wordsStream.keyBy(0).timeWindow(Time.seconds(15))
pod7payv1#
如果我理解正确,您希望对流的不同属性进行分组。对于这种情况,您可以简单地复制流:
val keyValuePair = wordsStream.keyBy(0).timeWindow(Time.seconds(15)) val keyValuePair2 = wordsStream.keyBy(1).timeWindow(Time.seconds(15)) // and so forth
调用流上的多个操作(即, wordsStream )您可以对同一数据执行多个计算。
wordsStream
1条答案
按热度按时间pod7payv1#
如果我理解正确,您希望对流的不同属性进行分组。对于这种情况,您可以简单地复制流:
调用流上的多个操作(即,
wordsStream
)您可以对同一数据执行多个计算。