有人知道如何在pig中使用输入/输出文件吗?我在 elephant-bird 中找到了对rcfile的某种支持,但似乎不支持orc格式。。。您能提供一个使用pig访问/存储pig中orc文件的示例吗?
olqngx591#
通过pig储存orc的支持尚未承诺,并且正在积极开发中。参考apache jira pig-3558。接下来,你就可以通过你的pig脚本访问orc文件了
load 'foo.orc' using OrcStorage(); ... store .. using OrcStorage('-c SNAPPY');
wgx48brx2#
使用存储为orc的hcat cli定义hcatalog表,然后使用org.apache.hcatalog.pig.hcatloader()或使用org.apache.hcatalog.pig.hcatstorer()在pig中加载关系
2条答案
按热度按时间olqngx591#
通过pig储存orc的支持尚未承诺,并且正在积极开发中。参考apache jira pig-3558。接下来,你就可以通过你的pig脚本访问orc文件了
wgx48brx2#
使用存储为orc的hcat cli定义hcatalog表,然后使用org.apache.hcatalog.pig.hcatloader()或使用org.apache.hcatalog.pig.hcatstorer()在pig中加载关系