我想在pyspark得到这个结果。我有请求URL列
tyu7yeag1#
您可以执行两次,并获得所需的结果
from pyspark.sql.functions import F df = df.withColumn( "full_url", F.regexp_extract(F.col("request_url"), "^GET ([^? ]*)", 1) ) df = df.withColumn( "short_url", F.regexp_extract(F.col("request_url"), "^GET ([^.]*)[.]", 1) )
1条答案
按热度按时间tyu7yeag1#
您可以执行两次,并获得所需的结果