我是一个有纯数学背景的数据科学家,所以我在工具方面有点学习曲线。通过在这个行业工作一年左右,我明白一个数据科学家也应该懂得一些数据工程。有人能给我点资源吗?我目前的技术主要包括python(pyspark)等。
h22fl7wq1#
这取决于你到底想了解hadoop生态系统什么。我建议你从这本书开始:hadoop:它的权威指南可以帮助您理解它是如何在引擎盖下工作的,并了解hadoop生态系统是由什么组成的。你不需要这本书的所有章节,但其中许多章节可能真的很有用。你也应该看看这本书spark—spark的权威指南通常用于数据科学领域。但这本书比上一本更实用。
1条答案
按热度按时间h22fl7wq1#
这取决于你到底想了解hadoop生态系统什么。
我建议你从这本书开始:
hadoop:它的权威指南可以帮助您理解它是如何在引擎盖下工作的,并了解hadoop生态系统是由什么组成的。你不需要这本书的所有章节,但其中许多章节可能真的很有用。
你也应该看看这本书
spark—spark的权威指南通常用于数据科学领域。但这本书比上一本更实用。