我有一家航空旅行社的用户数据,从这些数据中我想得到某个用户对某些实体最喜欢的值。我的数据集的格式如下-
userId From TO Meal Carrier Travel type
MT001 London Abu Dhabi Non Veg Lufthansa International
MT001 Abu Dhabi Beijing Veg Lufthansa International
MT001 New York Chicago Non Veg American Airlines Domestic
MT002 New York Texas Veg American Airlines Domestic
现在,我想获得用户mt001的preferred值,并对这个用户进行分类。我知道我们可以使用sql来获取这些值,但是可以使用mahout框架来实现吗?我不想实时得到结果,我想的是一个批处理作业,它对数据进行预处理,并将结果存储在某个地方,我们可以立即获取结果。
我知道mahout支持分类,我们可以使用基于项目的推荐之类的方法来获得首选值。我还计划转向hadoop,所以在这种情况下mahout的选择会有多好。
1条答案
按热度按时间dm7nw8vv1#
我想你要找的是基于内容的推荐,mahout确实支持基于内容的推荐,但我不确定它是否是实现它的最佳框架,你必须重写大量的类才能根据你的程序工作。
找到这个-为新数据集扩展mahout