像这样示例化doc2vec模型
mv_tags_doc = [TaggedDocument(words=word_tokenize_clean(D), tags=[str(i)]) for i, D in enumerate(mv_tags_corpus)]
max_epochs = 50
vector_size = 20
alpha = 0.025
model = Doc2Vec(size=vector_size,
alpha=alpha,
min_alpha=0.00025,
min_count=1,
dm=0)
model.build_vocab(mv_tags_doc)
但是得到了错误
TypeError: __init__() got an unexpected keyword argument 'size'
1条答案
按热度按时间bvjveswy1#
在您似乎正在使用的gensim库的最新版本中,参数
size
现在更加一致vector_size
到处都是。请参阅“迁移到gensim 4.0”帮助页:https://github.com/rare-technologies/gensim/wiki/migrating-from-gensim-3.x-to-4#1-size-ctr-parameter-is-now-consistent-vector_size-everywhere
另外,如果您正在查阅任何带有过时参数名称的在线示例,这也表明不必要的
min_alpha
及alpha
,很有可能你下面的例子在其他方面是一个不好的参考。所以,再看看这个答案:我的doc2vec代码经过多次循环训练后,并没有给出好的结果。可能有什么问题?