在docker容器上使用hadoop和spark

zz2j4svz 于 2021-06-02 发布在 Hadoop

关注(0)|答案(1)|浏览(310)

我想在工作中使用大数据分析。我已经实现了所有在容器中创建容器的docker工具。不过，我对大数据还很陌生，我逐渐认识到在hdfs中使用hadoop，在hadoop上使用spark而不是mapreduce，是网站和应用程序在速度问题上的最佳方式（是吗？）。这对我的码头集装箱有用吗？如果有人能指点我到什么地方多学点东西，那会很有帮助的。

hadoop yarn apache-spark docker bigdata

来源：https://stackoverflow.com/questions/37827700/using-hadoop-and-spark-on-docker-containers

1条答案

按热度按时间

ss2ws0br1#

您可以尝试使用cloudera quickstart docker映像开始。请看一看https://hub.docker.com/r/cloudera/quickstart/. 此docker映像支持cloudera的hadoop平台和cloudera manager的单节点部署。这个docker图像也支持spark。

赞(0）回复(0）举报 2021-06-02

我来回答

在docker容器上使用hadoop和spark

1条答案

相关问题

热门标签

最新问答