有没有办法不用hadoop在java中读写orc文件？

axkjgtzd 于 2021-05-27 发布在 Hadoop

关注(0)|答案(1)|浏览(541)

我的服务应该得到不同格式的文件，并从中获取信息。其中一种格式是 orc . 有什么方法可以从 RAM （作为字节数组）没有 hadoop 以及其他附加系统？在谷歌找不到任何方法(

1条答案

不用hadoop就可以读取文件。
拍摄于：阅读兽人档案。
使用orcfile类创建一个包含有关该文件的元数据的读取器。

Reader reader = OrcFile.createReader(new Path("my-file.orc"),
                  OrcFile.readerOptions(conf));

要获取数据，请创建recordreader对象

RecordReader rows = reader.rows();
VectorizedRowBatch batch = reader.getSchema().createRowBatch();

使用recordreader，用户可以请求下一批，直到没有剩余

while (rows.nextBatch(batch)) {
  for(int r=0; r < batch.size; ++r) {
    ... process row r from batch
  }
}
rows.close();

展开查看全部