apachehama是否适合构建决策树?

nzkunb0c  于 2021-06-03  发布在  Hadoop
关注(0)|答案(1)|浏览(364)

我目前已经在hadoop中实现了,这是google构建决策树(也称为planet)的框架。它从一个顶点开始,随着map reduce作业的增加,直到树完全构建。然而,一个主要问题是,许多map/reduce作业一个接一个地运行,因此一直以来启动新作业的成本非常高。
我见过很多次apachehama适合于像图这样的迭代算法。有人能用hama建立一个新的图吗?或者你只需要输入一个图并对它进行一些计算?把我的项目转给哈马容易吗??谢谢

w3nuxt5m

w3nuxt5m1#

hama确实能够使用planet论文中描述的算法构建决策树,其效率远远高于mapreduce。
hama不需要图形作为输入,您可以看看hamaml(机器学习)模块,它通常直接从hdfs处理原始特征向量作为输入。
对于hama,我在apachejira中创建了一个新版本来跟踪这个算法的进展。

相关问题