如何使用mrjob在hadoop集群中运行python库?

z3yyvxxp  于 2021-07-13  发布在  Hadoop
关注(0)|答案(0)|浏览(245)

我有一个python文件 load.file.py 使用 Bio 阅读基因序列的文库。

from mrjob.job import MRJob
from Bio import SeqIO

我在伪分布式模式下使用hadoop,当我使用以下命令运行代码时:

python load_file.py hdfs://localhost:9000/user/username/input/data.fna -r hadoop

但它不能运行并在 stderr 文件:

File "load_file.py", line 2, in <module>
    from Bio import SeqIO
ModuleNotFoundError: No module named 'Bio'

如何在hadoop集群中安装库以便它可以运行我的代码?我测试了我的设置与字数教程从 mrjob 并正常运行。

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题