假设我在accumulo有一张这样的table:
a cf1:cq1 [ ] 1
b cf1:cq1 [ ] 3
c cf1:cq1 [ ] 2
如果我在这个表上应用求和组合器并插入一行“ a cf1 cq1 2
“那么我得到的结果是:
a cf1:cq1 [ ] 3
b cf1:cq1 [ ] 3
c cf1:cq1 [ ] 2
我想知道的是,是否有迭代器可以帮助我在特定字段(如列限定符)上执行聚合。
简言之,我可以执行类似“的查询吗?” Sum of the values of those rows where column qualifier is cq1
".
如果这种查询没有现成的迭代器,我应该如何为它创建一个自定义迭代器呢?
1条答案
按热度按时间camsedfj1#
我不认为我们在accumulo有任何东西能直接满足你的要求,但是https://github.com/joshelser/accumulo-column-summing 非常相似,可以作为一个很好的起点。
您还可以尝试使用columnslicefilter,它将结果限制为所需的列限定符,并且可以轻松地编写summingiterator(或者只是在客户端对它们求和)。