pyspark 垃圾(junk)字符附加到实际 snowflake 表数据

2uluyalo  于 2023-11-16  发布在  Spark
关注(0)|答案(1)|浏览(126)

我正在执行一些夫妇的转换之前,写pyspark的框架,以 snowflake 表。我写了 snowflake 写在下面的方式。
第一个月
它对其他记录工作正常。但是对于这个特定的数据点,一些垃圾字符(junk char)被附加到数据中。

在此列上执行的操作:

1.当我们得到空字符串时,修剪数据。(例如:“data”)
1.在装载到 snowflake 之前铸造到字符串


的数据

6pp0gazn

6pp0gazn1#

ASCII NUL char(0)
您可以使用“\0”替换为“”

with data as (select '\0Record1' col1
union 
select '\0Record2'
)
select  replace(col1,'\0','') from data

字符串

相关问题