使用javaapi,我正在尝试 Put()
hbase 1.1.x中的某些文件的内容。为此,我创建了wholefileinput类(参考:在hadoop mapreduce中使用wholefileinputformat仍然会导致mapper一次处理一行),以使mapreduce读取整个文件,而不是一行。但不幸的是,我不知道如何从给定的文件名形成我的rowkey。
例子:
输入:
文件-123.txt
文件-524.txt
文件-9577.txt
...
文件-“anothernumber”.txt
我的hbase表上的结果:
行
4条答案
按热度按时间6bc51xsx1#
你的
可能是这样
其中前缀可以介于您在表创建时所做的预分裂之间。
例如:
前缀可以是在预拆分范围之间生成的任意随机id。
如果数据增加,这种行键也可以避免热点数据将分布在区域服务器上。
nnsrf1az2#
“第二个文件的内容”
…等等
如果有人已经面对这种情况来帮助我
提前谢谢。
8ulbf1ek3#
------值
123
nhaq1z214#
-----“第一个文件的内容”
524