python-3.x Gensim -尝试在gensim中加载文本文件

eaf3rand  于 2023-03-31  发布在  Python
关注(0)|答案(2)|浏览(163)

尝试用下面的代码在gensim中加载一个文件:

model = gensim.models.KeyedVectors.load_word2vec_format(r"C:/Users/dan/txt_sentoken/pos/cv000_29590.tx", binary=False)

但是,我得到这个错误:

ValueError: invalid literal for int() with base 10:'films'

帮助如何解决此错误?

rjzwgtxy

rjzwgtxy1#

每个语料库都需要以一行开始,其中依次包含词汇大小和向量大小。

jyztefdp

jyztefdp2#

第一行必须包含单词的数量和向量的维数。你可以在这里找到word2vec和glove格式的例子:This .

9 4
word1 0.123 0.134 0.532 0.152
word2 0.934 0.412 0.532 0.159
...

相关问题