我目前已经在hadoop中实现了,这是google构建决策树(也称为planet)的框架。它从一个顶点开始,随着map reduce作业的增加,直到树完全构建。然而,一个主要问题是,许多map/reduce作业一个接一个地运行,因此一直以来启动新作业的成本非常高。我见过很多次apachehama适合于像图这样的迭代算法。有人能用hama建立一个新的图吗?或者你只需要输入一个图并对它进行一些计算?把我的项目转给哈马容易吗??谢谢
w3nuxt5m1#
hama确实能够使用planet论文中描述的算法构建决策树,其效率远远高于mapreduce。hama不需要图形作为输入,您可以看看hamaml(机器学习)模块,它通常直接从hdfs处理原始特征向量作为输入。对于hama,我在apachejira中创建了一个新版本来跟踪这个算法的进展。
1条答案
按热度按时间w3nuxt5m1#
hama确实能够使用planet论文中描述的算法构建决策树,其效率远远高于mapreduce。
hama不需要图形作为输入,您可以看看hamaml(机器学习)模块,它通常直接从hdfs处理原始特征向量作为输入。
对于hama,我在apachejira中创建了一个新版本来跟踪这个算法的进展。