pyspark 如何使用spark ALS进行多行为隐式反馈推荐

jqjz2hbq  于 2023-10-15  发布在  Spark
关注(0)|答案(2)|浏览(152)

我想使用spark ALS进行多行为隐式反馈推荐。有几种类型的隐式用户行为数据,如浏览,购物车,交易等。
我已经检查了大量的在线来源ALS隐式反馈建议,但几乎所有的人都只利用单一的数据源,在购物的情况下,交易数据。
我想知道是否只需要交易数据或利用各种数据更好的结果?

mctunoxg

mctunoxg1#

没有通用的,原则性的方法来使用ALS与多种行为。有时候,不同的行为会改变隐含的评分--例如,查看一个项目可能值0.1,在多个会话中查看可能值0.3,将其放入购物车0.5,购买1.0。但这感觉有点像黑客,并且不容易提供一种利用您可能拥有的所有数据的方法。
对于一个更有原则的方法,可以扩展到处理许多不同的功能,我想看看Universal Recommender。免责声明:我从来没有用过,我只是觉得听起来很有希望。

46qrfjad

46qrfjad2#

是的,你最好使用所有的交易数据和用户数据。首先利用ALS算法获取用户向量和交易向量,然后计算交易与用户的相似度,如果用户或交易没有向量,则无法计算出用户或交易与用户的相似度。我对ALS进行了测试,并使用用户和交易的相似性来训练我的模型,它给了我很大的惊喜,auc如下:

  1. 2018-06-05 21:25:28,138 INFO [21:25:28] [58] test-auc:0.968764 train-auc:0.972966
  2. 2018-06-05 21:25:28,442 INFO [21:25:28] [59] test-auc:0.968865 train-auc:0.973075

因为我使用所有的交易和用户信息来训练模型。但是rmse是3.6,也许我应该调整我的参数。

相关问题