如何使用apachepig运行xml。我尝试了piggybank.storage.xmlloader函数,但它对我不起作用。我只在本地模式下运行清管器作业。没有错误,但它没有运行。有没有一种方法可以解析apache pig中的html页面。请帮帮我。提前谢谢
nsc4cvqm1#
您需要使用org.apache.pig.piggybank.storage.xmloader()和参数。还有xpath。我觉得这个很有用。
6ljaweal2#
请尝试以下代码:
register <PIG_HOME>/contrib/piggybank/java/piggybank.jar; A= LOAD '/xmlfile' USING org.apache.pig.piggybank.storage.XMLLoader('<XML_tag>');
对于pig mr模式,我的意思是在mr模式下运行pig,而不是在本地模式下运行(即pig-x local)。希望有帮助。
u3r8eeie3#
请尝试在mr模式下运行脚本。因为许多函数/操作只有在mr模式下才能正常工作。
3条答案
按热度按时间nsc4cvqm1#
您需要使用org.apache.pig.piggybank.storage.xmloader()和参数。还有xpath。我觉得这个很有用。
6ljaweal2#
请尝试以下代码:
对于pig mr模式,我的意思是在mr模式下运行pig,而不是在本地模式下运行(即pig-x local)。
希望有帮助。
u3r8eeie3#
请尝试在mr模式下运行脚本。因为许多函数/操作只有在mr模式下才能正常工作。