我正在考虑在hadoop中实现一个基于内容的推荐项目。如果weka可以与hadoop一起使用,或者对于基于cbf的实现使用mahout是明智的,那么只需要一些建议请告知谢谢
pepwfjgg1#
你的内容是什么?哪些数据围绕或组成了您的项目?有几种方法可以将其用于REC,有些方法可以在适当的情况下混合协作过滤数据。看看mahout中的rowsimilarity。它计算一个项目与所有其他项目的相似性。如果您输入内容的方式,它可以消化你将有一个cbr。例如,推荐类似博客文章的输入是:posted,来自文章文本的标记然后,对于每个posted,您将得到一个使用类似单词的其他posted的列表。您也可以对标记、类别或其他元数据执行相同的操作。
1条答案
按热度按时间pepwfjgg1#
你的内容是什么?哪些数据围绕或组成了您的项目?
有几种方法可以将其用于REC,有些方法可以在适当的情况下混合协作过滤数据。看看mahout中的rowsimilarity。它计算一个项目与所有其他项目的相似性。如果您输入内容的方式,它可以消化你将有一个cbr。
例如,推荐类似博客文章的输入是:posted,来自文章文本的标记
然后,对于每个posted,您将得到一个使用类似单词的其他posted的列表。您也可以对标记、类别或其他元数据执行相同的操作。