如何将hdfs中现有的文本数据转换为avro?

ffx8fchx  于 2021-05-31  发布在  Hadoop
关注(0)|答案(1)|浏览(409)

我在hdfs中有一个以文本格式存储的表,所以现在需要在其中添加新的列。所以我想在avro中加载新的列,因为avro支持模式演化,但是现在以前的数据仍然是文本格式。

0h4hbjxa

0h4hbjxa1#

如果已经有一个表,可以从配置单元直接将其加载到avro表中,否则可以为该文本文件创建配置单元表并将其加载到avro表中。像这样的

create table test(fields type)  row format delimited fields terminated by ',' stored as textile location 'textfilepath';
create table avrotbl like test stored as avrofile;
insert into abrotbl select * from test;

相关问题