在docker容器上使用hadoop和spark

zz2j4svz  于 2021-06-02  发布在  Hadoop
关注(0)|答案(1)|浏览(310)

我想在工作中使用大数据分析。我已经实现了所有在容器中创建容器的docker工具。不过,我对大数据还很陌生,我逐渐认识到在hdfs中使用hadoop,在hadoop上使用spark而不是mapreduce,是网站和应用程序在速度问题上的最佳方式(是吗?)。这对我的码头集装箱有用吗?如果有人能指点我到什么地方多学点东西,那会很有帮助的。

ss2ws0br

ss2ws0br1#

您可以尝试使用cloudera quickstart docker映像开始。请看一看https://hub.docker.com/r/cloudera/quickstart/. 此docker映像支持cloudera的hadoop平台和cloudera manager的单节点部署。这个docker图像也支持spark。

相关问题