ApacheTajo和ApacheHive之间的实际区别是什么

zfycwa2u  于 2021-05-29  发布在  Hadoop
关注(0)|答案(1)|浏览(394)

最近,apachetajo项目正在开发中。该项目的目标是“在hadoop中实现高级开源数据仓库系统,用于处理web级数据集”。
既然我们已经有了apachehive作为hadoop的数据仓库,并且现在已经在全球范围内得到了广泛的应用,那么这个新项目对于hadoop世界有多大的用处和不同呢?

oogrdqng

oogrdqng1#

如果你的仓库已经在 hive 里,我敢肯定你不必在短期内搬走。tajo试图进入的几个领域是:
低延迟查询(ad-hoc):使用impala/tez和cdh5.7附带的spark上的hive,您可能会获得足够快的结果。为了获得更快的响应,可以使用不同的db(通常不是dwh)。
全面的sql支持:只要使用hive的人已经习惯了hql,就不需要sql了。尽管您很容易理解为什么拥有完整的sql支持是一个好处。

相关问题