将数据从基于json serde的配置单元表加载到parquet表的问题

mbjcgjjk  于 2021-06-02  发布在  Hadoop
关注(0)|答案(0)|浏览(274)

我有一个 HIVE 使用 JSON Serde . 我用的是 Shark 分配(http://shark.cs.berkeley.edu/). 定义如下:

  1. CREATE TABLE lastfm(
  2. artist string,
  3. title string ,
  4. track_id string,
  5. similars array<array<string>>,
  6. tags array<array<string>>
  7. )
  8. ROW FORMAT SERDE 'org.openx.data.jsonserde.JsonSerDe';

我能够成功地将数据加载到此表中。现在,我创建了一个 Parquet 基于中的表 HIVE .

  1. CREATE TABLE lastfm_par (
  2. artist string,
  3. title string ,
  4. track_id string,
  5. similars array<array<string>>,
  6. tags array<array<string>>
  7. )
  8. ROW FORMAT SERDE 'parquet.hive.serde.ParquetHiveSerDe'
  9. STORED AS
  10. INPUTFORMAT 'parquet.hive.DeprecatedParquetInputFormat'
  11. OUTPUTFORMAT 'parquet.hive.DeprecatedParquetOutputFormat';

现在,我尝试从 JSON Serde 餐桌 Parquet 一个使用以下命令:

  1. insert overwrite table lastfm_par select * from lastfm;

这个 insert 语句已成功完成。但是当我查询 Parquet 表中,所有列都填充了 NULL 价值观。我在网上搜索过类似的问题,但还没有看到类似的东西。有人对这里出了什么问题有什么想法吗?
谢谢,维萨克

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题