我有一个注册到pyspark的udf,它的任务是通过使用函数的参数a和b构建url来查询web。在运行时,它计算 Column<b'(colA + colB)'>
在打印报表时。
如何得到参数a和b中的字符串?
def udf_func(a, b):
print(a + b)
return requests.get(a + b)
get = udf(udf_func, ByteType())
df = df.withColumn("output", get(col("colA"), col("colB")))
谢谢
1条答案
按热度按时间unftdfkk1#
您可以按以下方式修改函数:
我不相信你可以打印自定义项内的值,因此我已经删除了它,但这应该为你工作。