hive中的印地语字符

enxuqcxy  于 2021-06-26  发布在  Hive
关注(0)|答案(0)|浏览(157)

我有一个json文件,它的一些列值中有换行符。因此,当我通过sparksql在hive中加载这些数据时,我最终使用 saveAsTable() 创建表而不是直接创建表命令 saveAsTable() 在配置单元中创建一个表链接,同时还存储换行符(这在通常的插入中是不可能的)。
但是在同一个文件/表中,我有一些印地语值(存储在unicode字符中)( \u**** ). 现在我需要在表中显示这些值,或者至少我需要准备一个 select 可以从此表中提取记录以便显示印地语值的查询。
我明白 tblproperties 可用于设置 characterset 在表中存储印地语值。
但是因为我是用 saveAsTable 不是通常的create table命令,我试着运行-

alter table node set TBLPROPERTIES('serialization.encoding'='windows-1252')

在只使用一个伪记录创建表之后。
但看起来这不管用。
我有没有办法用印地语存储或至少提取正确显示的值?

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题