使用循环将数据添加到hashmap中

mspsb9vt  于 2021-05-29  发布在  Hadoop
关注(0)|答案(1)|浏览(467)

我试图把从序列文件中读取的数据放入哈希Map中。循环完成后,我尝试打印错误的内容。
我试着只打印第一个循环中的键和值,结果是正确的。当我尝试在第二个while循环中打印键时,结果是几个重复的记录。我搞不清楚出了什么问题。

while(reader.next(key, value)) {
        byte[] value_bytes = value.getBytes();
        data_HashMap.put(key, value_bytes);
    }

    IOUtils.closeStream(reader);

    Iterator<Text> keySetIterator = data_HashMap.keySet().iterator();
    while(keySetIterator.hasNext()){
      Text index = keySetIterator.next();
      System.out.println("key: " + index);
    }

这是结果

Key: 123
Key: 123
Key: 123
Key: 123
Key: 123
Key: 123

如果我像这样修改第一个while循环

while(reader.next(key, value)) {
    byte[] value_bytes = value.getBytes();
    System.out.println("Key: " + key);
}

这是结果,它是正确的。

Key: 123
Key: 456
Key: 789
Key: 741
Key: 852
Key: 963
jogvjijk

jogvjijk1#

您正在重新使用同一个密钥:

while(reader.next(key, value)) {
    byte[] value_bytes = value.getBytes();
    data_HashMap.put(**key**, value_bytes);
}

我不知道是什么类型,但如果是 Text ,只需复制或使用 String 相反。

while(reader.next(key, value)) {
    byte[] value_bytes = value.getBytes();
    data_HashMap.put(key.toString(), value_bytes);
}

值字节也会遇到同样的问题,因此我建议您也对该数组进行防御复制。

相关问题