无法通过hcatalog将配置单元表加载到pig中

aemubtdh  于 2021-06-21  发布在  Pig
关注(0)|答案(1)|浏览(373)

我目前正在centos 6.5上使用本教程配置cloudera hdp开发人员映像,安装基座,然后根据需要添加不同的组件。目前,我正在使用上面链接的教程的这一部分安装/测试hcatalog。
我已经成功安装了该软件包,现在正在使用以下脚本测试hcatalog与pig的集成:

A = LOAD 'groups' USING org.apache.hcatalog.pig.HCatLoader(); 
DESCRIBE A;

在运行命令之前,我已经在配置单元中创建并填充了一个“groups”表。当我用命令运行脚本时 pig -useHCatalog test.pig 我得到的是一个异常,而不是预期的输出。下面是stacktrace的初始部分:

Pig Stack Trace
---------------
ERROR 2245: Cannot get schema from loadFunc org.apache.hcatalog.pig.HCatLoader

org.apache.pig.impl.logicalLayer.FrontendException: ERROR 1000: Error during parsing. Cannot get schema from loadFunc org.apache.hcatalog.pig.HCatLoader
    at org.apache.pig.PigServer$Graph.parseQuery(PigServer.java:1608)
    at org.apache.pig.PigServer$Graph.registerQuery(PigServer.java:1547)
    at org.apache.pig.PigServer.registerQuery(PigServer.java:518)
    at org.apache.pig.tools.grunt.GruntParser.processPig(GruntParser.java:991)
    at org.apache.pig.tools.pigscript.parser.PigScriptParser.parse(PigScriptParser.java:412)
...

以前有人遇到过这个错误吗?任何帮助都将不胜感激。如果你需要的话,我很乐意提供更多的信息。

vof42yt1

vof42yt11#

错误是由于hbase的旧服务器配置不正确造成的。我安装/配置了thrift,并将以下内容添加到我的hive-xml.site中,并添加了正确的服务器信息:

<property>
    <name>hive.metastore.uris</name>
    <value>thrift://<!--URL of Your Server-->:9083</value>
    <description>IP address (or fully-qualified domain name) and port of the metastore host</description>
</property>

我以为上面的代码片段不是必需的,因为我是在伪分布式模式下运行cloudera hdp的。

相关问题