我有一个包含多个avro记录的文件。每个记录都包含一个唯一的“名称”。如何加载和存储文件,使每个文件都表示一个与给定名称对应的记录?
以下是我的avro模式:
{
"type": "records",
"name": "XXItem",
"namespace": "com.xxx.xxx",
"fields": [
{
"name": "data",
"type": {"type": "map", "values" : ["string", "long", "int"]}
}
]
}
1条答案
按热度按时间jobtbby31#
快速检查似乎表明avro只是使用json存储数据。通过寻找处理json的解决方案,您应该能够找到适合自己的解决方案。
这可能是一个起点:hadoop for json文件