尝试用下面的代码在gensim中加载一个文件:
model = gensim.models.KeyedVectors.load_word2vec_format(r"C:/Users/dan/txt_sentoken/pos/cv000_29590.tx", binary=False)
但是,我得到这个错误:
ValueError: invalid literal for int() with base 10:'films'
帮助如何解决此错误?
尝试用下面的代码在gensim中加载一个文件:
model = gensim.models.KeyedVectors.load_word2vec_format(r"C:/Users/dan/txt_sentoken/pos/cv000_29590.tx", binary=False)
但是,我得到这个错误:
ValueError: invalid literal for int() with base 10:'films'
帮助如何解决此错误?
2条答案
按热度按时间rjzwgtxy1#
每个语料库都需要以一行开始,其中依次包含词汇大小和向量大小。
jyztefdp2#
第一行必须包含单词的数量和向量的维数。你可以在这里找到word2vec和glove格式的例子:This .