我尝试从下面的表结构中提取以srsa
开头的id
id reason_text_field
34394 {"initial_customer":"sda_WWyfr4AXY1fIAS", customer_result":"srsa_CAkAaAvNKL2OSD"}
以获得以下输出:
id srsa_id
34394 srsa_CAkAaAvNKL2OSD
但是当我使用下面的SparkSQL函数时
REGEXP_EXTRACT(reason_text_field, 'srsa[^"]*') as srsa_id
我得到这个错误:
异常错误:没有群组
1条答案
按热度按时间kmbjn2e31#
需要指定要捕获的组。请尝试以下操作:
但是请注意,您也可以使用
from_json
将文本列reason_text_field
转换为map或struct,然后提取字段customer_result
: