了解hadoop生态系统的最佳方法是什么

eivgtgni  于 2021-05-27  发布在  Hadoop
关注(0)|答案(1)|浏览(451)

我是一个有纯数学背景的数据科学家,所以我在工具方面有点学习曲线。通过在这个行业工作一年左右,我明白一个数据科学家也应该懂得一些数据工程。有人能给我点资源吗?我目前的技术主要包括python(pyspark)等。

h22fl7wq

h22fl7wq1#

这取决于你到底想了解hadoop生态系统什么。
我建议你从这本书开始:
hadoop:它的权威指南可以帮助您理解它是如何在引擎盖下工作的,并了解hadoop生态系统是由什么组成的。你不需要这本书的所有章节,但其中许多章节可能真的很有用。
你也应该看看这本书
spark—spark的权威指南通常用于数据科学领域。但这本书比上一本更实用。

相关问题