我刚开始使用hadoop,我需要用它来计算一个非常大的数据集的关联规则。我无法理解如何使用r hadoop和mapreduce从数据集中查找关联规则。我有事务矩阵,但我需要做什么来执行apriori算法与这个矩阵与hadoop??这是用于执行apriori(package arules)的命令
rules <- apriori(incidence.matrix , parameter = list(minlen=2, supp=0.09, conf=0.95))
我需要在map函数中使用它,在reduce函数中?
1条答案
按热度按时间wnrlj8wa1#
我也有同样的问题(r在arules的大数据集上崩溃),你可以使用mahout,它是hadoop上面的一个机器学习引擎,它有关联规则和其他机器学习算法(比如集群)。。等等)