如何在计数器更新之前获取以前的状态

vnjpjtjt 于 2021-06-24 发布在 Storm

关注(0)|答案(1)|浏览(342)

例如，我有一批大小为第5批的元组，其中包含用户的印象：

Batch 1:
[UUID1, clientId1]
[UUID2, clientId1]
[UUID2, clientId1]
[UUID2, clientId1]
[UUID3, clientId2]

Batch 2:
[UUID4, clientId1]
[UUID5, clientId1]
[UUID5, clientId1]
[UUID6, clientId2]
[UUID6, clientId2]

这是我保存计数状态的例子：

TridentState ClientState = impressionStream
    .groupBy(new Fields("clientId"))
    .persistentAggregate(getCassandraStateFactory("users", "DataComputation",
        "UserImpressionCounter"), new Count(), new Fields("count));

Stream ClientStream = ClientState.newValuesStream();

我有明确的数据库和运行我的拓扑结构。在按clientid对流进行分组之后，我使用persistentaggregate函数和count aggregator保存状态。对于第一批，是newvaluesstream方法之后的结果： [clientId1, 4] , [clientId2, 1] . 第二批： [clientId1, 7] , [clientId2, 3] 一如预期。
clientstream在几个分支中使用，在其中一个分支中，我需要处理元组，以便使用大小为1的批处理，因为我需要关于每个元组计数的信息。大小为1的批显然是垃圾，所以我必须找出计数器的前一个状态，然后再更新它，并用tuple发出此信息，因为已经更新了计数器，例如，对于第二批 [clientId1, 7, 4] .
有人知道怎么做吗？

apache-storm trident

来源：https://stackoverflow.com/questions/20375934/how-to-get-previous-state-before-counter-update

1条答案

按热度按时间

vatpfxk51#

我已通过添加新聚合器并加入持久聚合解决了此问题：

TridentState ClientState = impressionStream
    .groupBy(new Fields("clientId"))
    .persistentAggregate(getCassandraStateFactory("users", "DataComputation",
        "UserImpressionCounter"), new Count(), new Fields("count));

Stream ClientBatchAggregationStream = impressionStream
    .groupBy(new Fields("clientId"))
    .aggregate(new SumCountAggregator(), new Fields("batchCount"));

Stream GroupingPeriodCounterStateStream = topology
    .join(ClientState.newValuesStream(), new Fields("clientId"),
        ClientBatchAggregationStream, new Fields("clientId"), 
        new Fields("clientId", "count", "batchCount"));

汇总器：

public class SumCountAggregator extends BaseAggregator<SumCountAggregator.CountState> {

    static class CountState {
        long count = 0;
    }

    @Override
    public CountState init(Object batchId, TridentCollector collector) {
        return new CountState();
    }

    @Override
    public void aggregate(CountState state, TridentTuple tuple, TridentCollector collector)            {
        state.count += 1;
    }

    @Override
    public void complete(CountState state, TridentCollector collector) {
        collector.emit(new Values(state.count));
    }

}

赞(0）回复(0）举报 2021-06-24

我来回答

如何在计数器更新之前获取以前的状态

1条答案

相关问题

热门标签

最新问答