我在hbase表中有1亿条记录。我已经创建了配置单元外部表。如何以最快的方式查询记录。配置单元--->从表中选择计数(*)。运行查询超过8小时。请引导我
q9yhzks01#
配置单元直接支持count()查询- SELECT COUNT(*) FROM table 但是它会随着你的记录增加而变慢,因为hive使用mapreduce作业。如果您想快速查询,我建议您使用apachephoenix或orm工具kundera
SELECT COUNT(*) FROM table
wwodge7n2#
我认为更好的方法是在内置行计数器操作中使用hbase,它在内部运行map reduce作业来计算行数。语法: hbase org.apache.hadoop.hbase.mapreduce.RowCounter mytable
hbase org.apache.hadoop.hbase.mapreduce.RowCounter mytable
2条答案
按热度按时间q9yhzks01#
配置单元直接支持count()查询-
SELECT COUNT(*) FROM table
但是它会随着你的记录增加而变慢,因为hive使用mapreduce作业。如果您想快速查询,我建议您使用apachephoenix或orm工具kunderawwodge7n2#
我认为更好的方法是在内置行计数器操作中使用hbase,它在内部运行map reduce作业来计算行数。
语法:
hbase org.apache.hadoop.hbase.mapreduce.RowCounter mytable