我试图让ambari在两台运行HortonWorksHDP2.3沙盒的硬件机器之间工作。
两台机器都可以在没有密码的情况下从终端成功地ssh到对方。我正在尝试向主计算机(sandbox.hortonworks.com)上的ambari添加一个新的数据节点(server1.hortonworks.com)。我只能假设我使用的fqdn是正确的,因为所有东西都是从终端工作的。我能成功
ssh server1
将服务器1的fqdn与专用rsa密钥一起添加到主计算机,然后继续操作时,失败并显示:
已跳过1个注册失败的主机上的主机检查。
我真的不知道从这里去哪里得到另一个主机添加正确。
3条答案
按热度按时间mqxuamgl1#
如果收到错误消息:
主机注册已中止。ambari代理主机无法访问ambari服务器的sandbox.hortonworks。com:8080'. 请检查ambari代理主机和到server1.hortonworks.com的ambari服务器连接之间的网络连接是否已关闭。
注意:server1.hortonworks.com是应该安装ambari代理的节点。如果您看到日志文件,您可以看到命令尝试在server1.hortonworks.com上设置ambari代理-“/usr/lib/python2.6/site packages/ambari\u server/setupagent.py”
解决方案:请检查以下步骤:https://community.hortonworks.com/storage/attachments/2562-network-setup.pdf
t0ybt7op2#
以下是单击失败时看到的错误消息:
============================正在创建目标目录…===============================命令开始时间2016-03-03 22:38:13到server1.hortonworks.com的连接关闭。ssh命令执行已完成host=server1.hortonworks.com,exitcode=0命令结束时间2016-03-03 22:38:13==========================正在复制公用函数脚本…===============================命令开始时间2016-03-03 22:38:13 scp/usr/lib/python2.6/site-packages/ambari\u commons host=server1.hortonworks.com,exitcode=0命令结束时间2016-03-03 22:38:14=============================正在复制操作系统类型检查脚本…=========================命令开始时间2016-03-03 22:38:14 scp/usr/lib/python2.6/site-packages/ambari\u server/os\u check\u type.py host=server1.hortonworks.com,exitcode=0命令结束时间2016-03-03 22:38:14=============================正在运行操作系统类型检查…=========================命令开始时间2016-03-03 22:38:14群集主/群集操作系统系列为redhat6,本地/当前操作系统系列为redhat6到server1.hortonworks.com的连接已关闭。ssh命令执行已完成host=server1.hortonworks.com,exitcode=0命令结束时间2016-03-03 22:38:14=============================正在检查远程主机上的“sudo”包…============================命令开始时间2016-03-03 22:38:14 sudo-1.8.6p3-20.el6\u 7.x86\u 64到server1.hortonworks.com的连接已关闭。ssh命令执行已完成host=server1.hortonworks.com,exitcode=0命令结束时间2016-03-03 22:38:15=========================正在将repo文件复制到“tmp”文件夹…===============================命令开始时间2016-03-03 22:38:15 scp/etc/yum.repos.d/ambari.repo host=server1.hortonworks.com,exitcode=0命令结束时间2016-03-03 22:38:15============================正在将文件移动到repo dir…===============================命令开始时间2016-03-03 22:38:15到server1.hortonworks.com的连接关闭。ssh命令执行已完成host=server1.hortonworks.com,exitcode=0命令结束时间2016-03-03 22:38:15=============================正在更改ambari.repo的权限…============================命令开始时间2016-03-03 22:38:15到server1.hortonworks.com的连接关闭。ssh命令执行完成host=server1.hortonworks.com,exitcode=0命令结束时间2016-03-03 22:38:15==========================正在复制安装脚本文件…===============================命令开始时间2016-03-03 22:38:15 scp/usr/lib/python2.6/site-packages/ambari\u server/setupagent.py host=server1.hortonworks.com,exitcode=0命令结束时间2016-03-03 22:38:15=============================正在运行安装代理脚本…======================命令开始时间2016-03-03 22:38:15主机注册中止。ambari代理主机无法访问ambari服务器的sandbox.hortonworks。com:8080'. 请检查ambari代理主机和到server1.hortonworks.com的ambari服务器连接之间的网络连接是否已关闭。ssh命令执行已完成host=server1.hortonworks.com,exitcode=1命令结束时间2016-03-03 22:38:16错误:主机server1.hortonworks.com的引导失败,因为上一个操作已完成,退出代码为非零(1)错误消息:tcgetattr:到server1.hortonworks.com的参数连接无效已关闭。stdout:主机注册已中止。ambari代理主机无法访问ambari服务器的sandbox.hortonworks。com:8080'. 请检查ambari代理主机和到server1.hortonworks.com的ambari服务器连接之间的网络连接是否已关闭。
64jmpszr3#
通过单击红色的失败文本,可以深入查看确切的失败。包括日志将帮助我们解决您的问题。
如果没有在日志中看到确切的故障,我猜这很可能是dns问题,因为您使用的是hortonworks.com域。是否在每个节点的/etc/hosts文件中添加了两个服务器的条目?
在每个节点上运行以下命令以分别获得正确的fqdn和ip。
一旦有了这些值,就需要将它们添加到每个主机上的/etc/hosts文件中。
例如,如果获得值:
然后需要向每个/etc/hosts文件添加以下两行: