在hbase表中存储的json中有没有快速搜索的方法?例如,我有一些json字符串保存在同一列中的表umnfamily:column:
1 {"name":"John McClane","hat_color":"green"}
2 {"name":"Rocky Balboa","hat_color":"red"}
.......
9999 {"name":"Super Man","hat_color":"green"}
.......
我要找到所有戴绿帽子的人的行号。
假设表太大,无法使用简单的mapreduce作业,这将解析json
也许有一种方法可以索引json字段?
1条答案
按热度按时间dz6r00yl1#
您可以尝试将扫描操作与hbase value filter一起使用
运算符=
CompareFilter.CompareOp.EQUAL
比较器=RegexStringComparator
正则表达式字符串是"hat_color":"green"}$
我不知道与mapreduce作业的性能比较,但是对于一个简单的检索操作来说应该可以做到注意:还要看hbase单列值过滤器