我是虚拟机分布式学习的新手。现在我有了一个大的数据集,想在googleclouddataproc上运行xgboost。我查看了xgboostgit中关于在aws上运行的教程,但我认为这与googlecloud不同。任何建议,相关链接,教程将不胜感激!真诚的!
eblbsuwk1#
我会这么说 Google Cloud Machine Learning Engine ( Cloud ML )是最适合机器学习算法的产品,因为它是一种托管服务,您可以专注于模型开发而不必担心基础设施。下面是一个关于使用xgboost进行在线预测的教程 Cloud ML .正如您提到的,您有一个大的数据集,也许有兴趣看看这个文档,它解释了如何结合使用 Google Cloud Dataproc 对数据进行预处理 Cloud ML 为了预测。
Google Cloud Machine Learning Engine
Cloud ML
Google Cloud Dataproc
1条答案
按热度按时间eblbsuwk1#
我会这么说
Google Cloud Machine Learning Engine
(Cloud ML
)是最适合机器学习算法的产品,因为它是一种托管服务,您可以专注于模型开发而不必担心基础设施。下面是一个关于使用xgboost进行在线预测的教程Cloud ML
.正如您提到的,您有一个大的数据集,也许有兴趣看看这个文档,它解释了如何结合使用
Google Cloud Dataproc
对数据进行预处理Cloud ML
为了预测。