如何使用mrjob在hadoop集群中运行python库？

z3yyvxxp 于 2021-07-13 发布在 Hadoop

关注(0)|答案(0)|浏览(256)

我有一个python文件 load.file.py 使用 Bio 阅读基因序列的文库。

from mrjob.job import MRJob
from Bio import SeqIO

我在伪分布式模式下使用hadoop，当我使用以下命令运行代码时：

python load_file.py hdfs://localhost:9000/user/username/input/data.fna -r hadoop

但它不能运行并在 stderr 文件：

File "load_file.py", line 2, in <module>
    from Bio import SeqIO
ModuleNotFoundError: No module named 'Bio'

如何在hadoop集群中安装库以便它可以运行我的代码？我测试了我的设置与字数教程从 mrjob 并正常运行。

目前还没有任何答案，快来回答吧！

相关问题