我想了解 Record
在 MapReduce
hadoop,用于文本以外的数据类型。
一般来说 Text
数据记录以新行结束。
现在,如果我们想处理一个xml数据,这个数据是如何处理的,也就是说,一个 Record
定义是什么 mapper
会有用吗?
我读到有一个概念 InputFormat
以及 RecordReader
,但我没弄清楚。
有谁能帮我了解一下 InputFormat
, RecordReader
对于各种类型的数据集(文本除外),如何将数据转换为 Records
哪个 mapper
在上面工作?
1条答案
按热度按时间ubbxdtey1#
更多信息:
http://bytepadding.com/big-data/map-reduce/understanding-map-reduce-the-missing-guide/