我有一个json文件,它的一些列值中有换行符。因此,当我通过sparksql在hive中加载这些数据时,我最终使用 saveAsTable()
创建表而不是直接创建表命令 saveAsTable()
在配置单元中创建一个表链接,同时还存储换行符(这在通常的插入中是不可能的)。
但是在同一个文件/表中,我有一些印地语值(存储在unicode字符中)( \u****
). 现在我需要在表中显示这些值,或者至少我需要准备一个 select
可以从此表中提取记录以便显示印地语值的查询。
我明白 tblproperties
可用于设置 characterset
在表中存储印地语值。
但是因为我是用 saveAsTable
不是通常的create table命令,我试着运行-
alter table node set TBLPROPERTIES('serialization.encoding'='windows-1252')
在只使用一个伪记录创建表之后。
但看起来这不管用。
我有没有办法用印地语存储或至少提取正确显示的值?
暂无答案!
目前还没有任何答案,快来回答吧!