我的服务应该得到不同格式的文件,并从中获取信息。其中一种格式是 orc . 有什么方法可以从 RAM (作为字节数组)没有 hadoop 以及其他附加系统?在谷歌找不到任何方法(
orc
RAM
hadoop
uqcuzwp81#
不用hadoop就可以读取文件。拍摄于:阅读兽人档案。使用orcfile类创建一个包含有关该文件的元数据的读取器。
Reader reader = OrcFile.createReader(new Path("my-file.orc"), OrcFile.readerOptions(conf));
Reader reader = OrcFile.createReader(new Path("my-file.orc"),
OrcFile.readerOptions(conf));
要获取数据,请创建recordreader对象
RecordReader rows = reader.rows();VectorizedRowBatch batch = reader.getSchema().createRowBatch();
RecordReader rows = reader.rows();
VectorizedRowBatch batch = reader.getSchema().createRowBatch();
使用recordreader,用户可以请求下一批,直到没有剩余
while (rows.nextBatch(batch)) { for(int r=0; r < batch.size; ++r) { ... process row r from batch }}rows.close();
while (rows.nextBatch(batch)) {
for(int r=0; r < batch.size; ++r) {
... process row r from batch
}
rows.close();
1条答案
按热度按时间uqcuzwp81#
不用hadoop就可以读取文件。
拍摄于:阅读兽人档案。
使用orcfile类创建一个包含有关该文件的元数据的读取器。
要获取数据,请创建recordreader对象
使用recordreader,用户可以请求下一批,直到没有剩余