pig python自定义项和lxml

idfiyjo8  于 2021-06-03  发布在  Hadoop
关注(0)|答案(1)|浏览(405)

我有一个使用lxml的python自定义项。我使用自定义项的Pig工作失败了:

File "PigParse.py", line 10, in ParseToPig ImportError: No module named lxml

python脚本作为一个独立程序运行良好,其第10行是:

from lxml import etree

我是否需要以某种方式将lxml分发到hadoop集群,如果需要,我应该如何使用lxml以及使用哪个版本?
我看到过使用hadoop文件分发nltk的例子,但对pig没有。
tia!!!

xe55xuns

xe55xuns1#

我想我的问题是因为我用的是jython:

`REGISTER 'PigParse.py' using jython as PP;

你不能把lxml和jython一起使用

相关问题