我可以从spark提供什么样的ml算法?有流算法,如streamingkmeans或streaminglineargression。它们可以有一个用于训练和测试的输入流。
此外,还有许多其他算法,如als或决策树,在spark网站上的示例中,这些算法只经过静态数据集的训练和测试。
我的问题是,我是否可以将流数据集用于那些不是为流而设计的算法。
例如:https://spark.apache.org/docs/latest/ml-collaborative-filtering.html . 这个exmaple只读取静态文件。我可以使用流式输入这个算法吗?
暂无答案!
目前还没有任何答案,快来回答吧!