什么是hadoop最佳实践的站点

46qrfjad  于 2021-06-03  发布在  Hadoop
关注(0)|答案(2)|浏览(316)

什么是hadoop最佳实践的站点,而不是那些我可以一步一步地创建新项目和小示例的书籍。我找不到像这样的网站,请分享。

6rqinv9w

6rqinv9w1#

有一篇来自yahoo开发者的关于apachehadoop的文章:最佳实践和反模式

yxyvkwin

yxyvkwin2#

hadoop不是一个单一的应用程序,而是一个分布式处理框架,它由位于这个框架之上的几个应用程序使用。pig、hive、hbase、cassandra等都是为特定需求设计的。所有这些应用程序的底层都使用hadoop框架,hadoop框架主要由分布式文件系统(hdfs)和分布式处理(mapreduce)组成。
从技术上讲,当您拥有一个最小的hadoop集群(仅限于hdfs+mapreduce)时,您可以开始编写基于mapreduce的应用程序(通过hadoop流支持java或其他语言)来处理一些数据。
您可以首先从cloudera或hortonworks发行版下载预构建/配置的hadoop虚拟映像,并在您的机器上运行它。之后,开始学习用java编写mapreduce作业并在虚拟机中运行。
以下是下载ClouderaHadoop分发虚拟机的url
这里是学习写最简单的字数作业的链接。

相关问题