如何在mahout中获取集群的主题和文件?

n9vozmp4  于 2021-06-02  发布在  Hadoop
关注(0)|答案(1)|浏览(343)

我是新手。我想知道如何获得特定集群的主题和该集群的文件名。i、 e这些文件与这些主题一起聚集到这个集群中。我听说有一个实用的clusterdumper可以完成这个任务。但我不知道怎么做。有人能举个例子来完成这项任务吗?

dgenwo3n

dgenwo3n1#

群集!=主题建模。
假设你说的是k-means,集群会给你一个平均词频向量。对于终端用户来说,把这个主题变成一个有意义的主题是一项非常不同的任务,也是一项更具挑战性的任务。别以为马霍特会给你一个“美式足球”这样的好结果。不可能。没有人能在无人监督的情况下做这件事。

相关问题