apache hawq产品用法

tjrkku2a  于 2021-06-02  发布在  Hadoop
关注(0)|答案(2)|浏览(466)

我不知道还有什么地方可以问这个问题,所以我会在这里问,因为我认为这可能会为将来可能有类似问题的用户提供一个很好的参考。
apache hawq有任何已知的生产用法吗(http://hawq.incubator.apache.org/)? 我想将此服务与其他服务(如presto、spark、impala等)进行比较,但除了好看的基准测试之外,我还没有遇到其他任何实际使用它的方法。最后,如果你亲自使用过这个,你有什么经验?

4c8rllxm

4c8rllxm1#

pivotal hdb(hawq的商业产品)在不同的客户中都有。hawq是真正的基于mpp历史的100%符合sql的sql引擎。这是一款独特的产品,具有最先进的查询优化器和动态分区消除功能,具有非常强大的hdfs数据联合功能,具有hbase、hive、json、orc(beta)和本机hadoop文件系统。hawq使用parquet存储格式,因此在hawq中创建的表可以在hadoop生态系统中使用。hawq能够收集外部表的统计信息,以便更快地访问数据。支持acid事务(插入)。除此之外,最引人注目的特性是在sql中使用语言扩展进行数据科学,支持r、python、java和perl。我在汽车、石油和天然气、物联网、医疗保健行业看到了hawq的实施。我经历的典型用例是hadoop之上的bi、数据科学模型训练和执行模型、结构化数据上的交互式sql。由于hawq源于greenplum传统,hawq的一些特性在竞争产品中很难找到。hawq是hadoop生态系统的完美补充。

qlckcl4x

qlckcl4x2#

目前apachehawq还没有独立的doc。但是社区正在将doc从关键的hdb迁移到apachehawq。页面上的文档链接链接到hdb文档(http://hdb.docs.pivotal.io/211/hdb/index.html). 你可以先参考这篇文章,你可以在网站上找到孵化器hawq docs项目https://github.com/apache/incubator-hawq-docs.
此外,如果您不知道在哪里提问,您可以订阅开发人员和用户邮件列表,发送电子邮件至dev-subscribe@hawq.incubator.apache.org / user-subscribe@hawq.incubator.apache.org 订阅并发送电子邮件至dev@hawq.incubator.apache.org / user@hawq.incubator.apache.org 问问题。

相关问题