我有一个python文件 load.file.py
使用 Bio
阅读基因序列的文库。
from mrjob.job import MRJob
from Bio import SeqIO
我在伪分布式模式下使用hadoop,当我使用以下命令运行代码时:
python load_file.py hdfs://localhost:9000/user/username/input/data.fna -r hadoop
但它不能运行并在 stderr
文件:
File "load_file.py", line 2, in <module>
from Bio import SeqIO
ModuleNotFoundError: No module named 'Bio'
如何在hadoop集群中安装库以便它可以运行我的代码?我测试了我的设置与字数教程从 mrjob
并正常运行。
暂无答案!
目前还没有任何答案,快来回答吧!