我正在寻找一个hbase shell命令,它将计算指定列族中的记录数。我知道我能跑:
echo "scan 'table_name'" | hbase shell | grep column_family_name | wc -l
但是,这将比标准计数命令运行得慢得多:
count 'table_name' , CACHE => 50000 (because the use of the CACHE=>50000)
更糟糕的是,它不会返回实际的记录数,而是返回指定列族中的单元格总数(如果我没弄错的话)。我需要这样的东西:
count 'table_name' , CACHE => 50000 , {COLUMNS => 'column_family_name'}
提前谢谢,
迈克尔
1条答案
按热度按时间xhv8bpkk1#
这是我在需要的时候编写的ruby代码。提供了适当的意见。它为你提供
HBase
贝壳count_table
命令。第一个参数是表名,第二个参数是属性数组,与的相同scan
shell命令。你的问题的直接答案是
我还建议添加缓存,如用于扫描:
以下是来源: