基于用户数据获取偏好

oogrdqng  于 2021-06-04  发布在  Hadoop
关注(0)|答案(1)|浏览(412)

我有一家航空旅行社的用户数据,从这些数据中我想得到某个用户对某些实体最喜欢的值。我的数据集的格式如下-

userId  From      TO        Meal    Carrier            Travel type

MT001   London    Abu Dhabi Non Veg Lufthansa          International
MT001   Abu Dhabi Beijing   Veg     Lufthansa          International
MT001   New York  Chicago   Non Veg American Airlines  Domestic
MT002   New York  Texas     Veg     American Airlines  Domestic

现在,我想获得用户mt001的preferred值,并对这个用户进行分类。我知道我们可以使用sql来获取这些值,但是可以使用mahout框架来实现吗?我不想实时得到结果,我想的是一个批处理作业,它对数据进行预处理,并将结果存储在某个地方,我们可以立即获取结果。
我知道mahout支持分类,我们可以使用基于项目的推荐之类的方法来获得首选值。我还计划转向hadoop,所以在这种情况下mahout的选择会有多好。

dm7nw8vv

dm7nw8vv1#

我想你要找的是基于内容的推荐,mahout确实支持基于内容的推荐,但我不确定它是否是实现它的最佳框架,你必须重写大量的类才能根据你的程序工作。
找到这个-为新数据集扩展mahout

相关问题