BERTopic 种子主题列表在1维后抛出与不均匀形状相关的错误,

hmmo2u0o  于 23天前  发布在  其他
关注(0)|答案(2)|浏览(18)

我正在使用以下代码来使用 seed_topic_list

embedding_model = 'all-mpnet-base-v2'
word_list = ["Bullion",'market','price','commodity',"precious", "metal",'gilt','carat','aurum','world', 'gold', 'council','mine','mining','bitcoin','forecast','bank','liquidity','ingot','stocks','delivery','settlement','ETF']
word_lists = [[word.lower()] for word in word_list]

model = BERTopic(
            verbose=True,
            min_topic_size=5,
            language="english",
            seed_topic_list = word_list,
            embedding_model = SentenceTransformer(embedding_model)
        )
topics, probs = model.fit_transform(df['news_article'])

我遇到了以下错误!

有人能告诉我,如何正确使用 seed_topic_list 吗?

olhwl3o2

olhwl3o21#

我相信这是一个known issue。你能检查这些以找到解决方案吗?我认为它与numpy的特定版本有关。

hwazgwia

hwazgwia2#

@Adi-ds 我将我的numpy版本降级到1.22.4,它对我有用。这个链接可能会帮助你。这个 link 可能会有所帮助。

相关问题