如何在数据块中创建HIVE格式的EXTERNAL表

9nvpjoqh  于 2022-11-05  发布在  Hive
关注(0)|答案(1)|浏览(147)

我在配置单元中有一个具有以下格式的外部表。

CREATE EXTERNAL TABLE cs_mbr_prov(
  key struct<inid:string,......>, 
  memkey string, 
  ob_id string, 
  .....
)

ROW FORMAT SERDE 
  'org.apache.hadoop.hive.hbase.HBaseSerDe' 
STORED BY 
  'org.apache.hadoop.hive.hbase.HBaseStorageHandler' 
WITH SERDEPROPERTIES ( 
  'hbase.columns.mapping'=' :key,ci:MEMKEY, .....', 
  'serialization.format'='1')

我想在Azure数据块中创建相同类型的表,其中我的输入和输出采用 parquet 格式。

yjghlzjz

yjghlzjz1#

根据official Doc,我创建并复制了***表***,输入***和***输出***为***parquet 格式

样本代码:

CREATE EXTERNAL TABLE `vams`(
  `country` string,
  `count` int)
ROW FORMAT SERDE
  'org.apache.hadoop.hive.ql.io.parquet.serde.ParquetHiveSerDe'

STORED AS INPUTFORMAT
  'org.apache.hadoop.hive.ql.io.SymlinkTextInputFormat'
OUTPUTFORMAT
  'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat'
LOCATION
  'dbfs:/FileStore/'
TBLPROPERTIES (
  'totalSize'='2335',
  'numRows'='240',
  'rawDataSize'='2095',
  'COLUMN_STATS_ACCURATE'='true',
  'numFiles'='1',
  'transient_lastDdlTime'='1418173653')

参考:

https://learn.microsoft.com/en-us/azure/databricks/spark/latest/spark-sql/language-manual/sql-ref-syntax-ddl-create-table-hiveformat

相关问题