如果我使用s3而不是hdfs，namenode还需要吗？

92dk7w1h 于 2021-06-02 发布在 Hadoop

关注(0)|答案(1)|浏览(375)

最近我正在用s3建立hadoop cluster over object store，所有的数据文件都存储在s3而不是hdfs中，并且我成功地在s3上运行了spark和mp，所以我想知道我的namenode是否仍然是必需的，如果是的话，当我在s3上运行hadoop应用程序时，namenode做了什么？谢谢。

hadoop hdfs amazon-s3 namenode

来源：https://stackoverflow.com/questions/47131612/is-namenode-still-necessary-if-i-use-s3-instead-of-hdfs

1条答案

按热度按时间

vom3gejh1#

不，前提是你有一个方法来处理s3缺乏运输工作提交人所需要的一致性这一事实。每隔一段时间，如果s3的列表不够一致，结果就会无效，你甚至不会注意到。
aws上spark的不同供应商以自己的方式解决了这个问题。如果您使用的是asf spark，那么没有任何捆绑包可以做到这一点。
https://www.youtube.com/watch?v=bghrff5yaqo

赞(0）回复(0）举报 2021-06-02

我来回答

如果我使用s3而不是hdfs，namenode还需要吗？

1条答案

相关问题

热门标签

最新问答