如何将归档或项目python添加到配置单元

fhity93d  于 2021-05-30  发布在  Hadoop
关注(0)|答案(1)|浏览(425)

如何将存档添加到配置单元例如:
配置单元>添加存档路径\u project/my\u project.tar.gz;
并执行此查询:
使用“python path\u project/script.py”从my\u yable limit 1中选择transform(字段\u 1,字段\u 2);
我试过了,但没用。
谢谢

puruo6ea

puruo6ea1#

我想把这个复制到hadoop map reduce-archives不解包的归档文件,但它不允许我因为答案那里不接受。

ADD ARCHIVE path_project/my_project.tar.gz;

添加存档时 path_project/my_project.tar.gz ,存档将被提取到 my_project.tar.gz/ ,因此需要将脚本引用为

SELECT transform(field_1,field_2)
USING 'python my_project.tar.gz/script.py'
FROM my_yable
LIMIT 1;

如果您查看文档类distributedcache中的示例,它意味着约定。顺便说一句:支持的存档格式是
存档(zip、tar和tgz/tar.gz文件)在工作节点上取消存档

相关问题