hadoop集群/hdfs是否需要跨所有节点存在用户?

ilmyapht  于 2021-05-29  发布在  Hadoop
关注(0)|答案(1)|浏览(455)

在mapr hadoop中,为了让用户能够访问hdfs或使用yarn进行程序,它们需要存在于集群中的所有节点(具有相同的uid和gid),这包括既不充当数据节点也不充当控制节点的客户机节点(mapr实际上没有namenodes的概念)。hortonworks hdp也是这样吗?

brqmpdu1

brqmpdu11#

在hortonworks社区网站上找到了以下答案:
用户不应该在集群的所有节点上都有帐户。他应该只在边缘节点上有帐户。
对于新用户,在用户访问集群之前,我们需要创建两种类型的目录。
1-用户主目录[在linux文件系统上创建的目录,即/home/]
2-用户hdfs目录[在hdfs文件系统上创建的目录,即/user/]
…您只需要在边缘节点上创建hdfs home directory[ie./user/]即可[由于hdfs似乎与任何特定的边缘节点无关,因此不确定此处的含义]。即使尚未在linux中创建新用户的主目录,您仍然可以在集群上与新用户一起运行作业。

**更新:根据user@cricket\u007的评论,似乎该用户也必须存在于namenode服务器上。我所能找到的最接近明确说明这一点的文件说:

每个文件或目录操作都会将完整路径名传递给namenode,并沿每个操作的路径应用权限检查。客户端框架将隐式地将用户标识与到namenode的连接相关联,从而减少对现有客户端api进行更改的需要。[…]例如,当客户机第一次开始读取文件时,它向namenode发出第一个请求,以发现文件的第一个块的位置。

相关问题