你总是可以跑 select foo from bar hawq中外部表的类型查询。但是,如果您的问题是pxf是否确实执行了列投影以避免读取所有列,那么答案是否定的。当前pxf将从orc文件中读取所有列,并将记录返回给hawq,hawq将在其末尾执行投影过滤。然而,https://issues.apache.org/jira/browse/hawq-583,正在积极研究中,应该在即将发布的hawq版本中发布,该版本将把列投影向下推到orc,以提高orc文件的读取性能 是的,查询优化器确实收集外部表的统计信息,这也由pxf处理。但是,这仅适用于某些数据源:https://issues.apache.org/jira/browse/hawq-44
1条答案
按热度按时间zqry0prt1#
你总是可以跑
select foo from bar
hawq中外部表的类型查询。但是,如果您的问题是pxf是否确实执行了列投影以避免读取所有列,那么答案是否定的。当前pxf将从orc文件中读取所有列,并将记录返回给hawq,hawq将在其末尾执行投影过滤。然而,https://issues.apache.org/jira/browse/hawq-583,正在积极研究中,应该在即将发布的hawq版本中发布,该版本将把列投影向下推到orc,以提高orc文件的读取性能是的,查询优化器确实收集外部表的统计信息,这也由pxf处理。但是,这仅适用于某些数据源:https://issues.apache.org/jira/browse/hawq-44