在pig级别将nulls作为别名处理

1l5u6lss  于 2021-06-02  发布在  Hadoop
关注(0)|答案(1)|浏览(267)

​大家好,
我有我的table结构和Hive如下。

Create table hv (x int,y int,z int ,w int )

用来装table的

A  = LOAD 'XYZ.CSV.GZ' using pigstorage AS (x,y,w)

这次z col在文件中丢失了,所以我想在piglatin中将z的值保持为null,并且我不想更改我的配置单元表结构。如何在pig中将此列的值生成为null??

quhf5bfb

quhf5bfb1#

对于空值和常量,可以执行以下操作:

--load your hive table
A = LOAD 'hive_db.table_name' USING org.apache.hive.hcatalog.pig.HCatLoader();

--this will generate a NULL column with datatype bytearray
B = FOREACH A GENERATE X,Y,NULL,W;

--then you can further process your data
STORE B INTO '/your/hdfs' USING PigStorage(',');

相关问题