我目前正在将一个sql管道转换为pyspark,但在翻译sql管道时遇到了一些困难 from_hex
功能到pyspark。我看到了一些解决方案,包括将字符串转换为int,然后转换为十六进制字节,但这似乎效率很低。有没有一种有效的方法将十六进制字符串的列转换为十六进制字节?
对于上下文,我需要联接另一个已采用字节格式的表:
on i.joining_column = from_hex(a.joining_column)
其中i已经是十六进制字节格式,a是一个字符串。
任何帮助都将不胜感激!
我确实看到了关于将字符串转换为int的内容,但不确定这在我的例子中是否有用。
1条答案
按热度按时间kxeu7u2r1#
你可以使用bultin函数
unhex
:dataframe api中也提供了该函数:
unhex