BERTopic DTM数据提取

kxe2p93d  于 23天前  发布在  其他
关注(0)|答案(4)|浏览(14)

如何筛选出DTM操作的结果,即每个主题在不同时间的频率?

tjrkku2a

tjrkku2a1#

我可能在这里犯了错误,但.topics_over_time的输出是否已经给出了每个主题在不同时间的频率?
它用于生成可视化here,显示每个主题在不同时间的频率。

polkgigr

polkgigr2#

我之前没有想到可以打印到这个函数,感谢回答!另外我想问一下,字段FREQUENCY具体代表什么?如何计算?

gcxthw6b

gcxthw6b3#

频率是否表示了在全局c-tf-idf下,对时间戳t进行平均后的得分?

jxct1oxe

jxct1oxe4#

频率正是如此,一个主题在某个特定时间戳(或在某些时间戳之间,如果你对数据进行了分箱)出现的频率。

相关问题