我们使用的是hdp hdfs模块版本2.7.3.2.6.5.0-292。
服务器被卡住了,必须硬重置-现在名称节点服务在启动时抛出一个错误。
在成功获取一个锁文件之后,它会通过再次尝试获取它而瞬间失败,即使它是针对同一个进程(可能是同一个线程)的,它也会失败。
如何用tact中的数据启动名称节点? 18/11/14 20:19:24 INFO util.GSet: Computing capacity for map NameNodeRetryCache 18/11/14 20:19:24 INFO util.GSet: VM type = 64-bit 18/11/14 20:19:24 INFO util.GSet: 0.029999999329447746% max memory 1011.3 MB = 310.7 KB 18/11/14 20:19:25 INFO util.GSet: capacity = 2^15 = 32768 entries 18/11/14 20:19:25 INFO common.Storage: Lock on /mnt/pd1/hadoop/hdfs/namenode/in_use.lock acquired by nodename 10635@hadoop-327 18/11/14 20:19:25 ERROR common.Storage: It appears that another node 10635@hadoop-327 has already locked the storage directory: /mnt/pd1/hadoop/hdfs/namenode java.nio.channels.OverlappingFileLockException at sun.nio.ch.SharedFileLockTable.checkList(FileLockTable.java:255) at sun.nio.ch.SharedFileLockTable.add(FileLockTable.java:152) at sun.nio.ch.FileChannelImpl.tryLock(FileChannelImpl.java:1113) at java.nio.channels.FileChannel.tryLock(FileChannel.java:1155) at org.apache.hadoop.hdfs.server.common.Storage$StorageDirectory.tryLock(Storage.java:770) at org.apache.hadoop.hdfs.server.common.Storage$StorageDirectory.lock(Storage.java:738) at org.apache.hadoop.hdfs.server.common.Storage$StorageDirectory.analyzeStorage(Storage.java:551) at org.apache.hadoop.hdfs.server.common.Storage$StorageDirectory.analyzeStorage(Storage.java:502)
1条答案
按热度按时间zfciruhq1#
所以看起来我们有两条路径指向同一个目录
dfs.namenode.name.dir
,导致双重锁定。一旦我们用了一条路,一切都恢复正常了。