我对regexp函数相当陌生。我正在使用sql语法尝试提取url的某些路径。
url示例:
https://www.test.com/private/how-to-extract/certain/paths/with-regexp.html
1 2 3 4 5
因此,我的第一列应该包括路径nr1:private第二列路径nr2:how to extract third column:some fourth column:paths fifth column:with regexp
我尝试了以下方法:
,replace(regexp(URL, '(.*?)\/(.*?)', '$2'), '%20', ' ') as path1
,replace(regexp(URL, '(.*?)\/(.*?)\/(.*?)', '$3'), '%20', ' ') as path2
,replace(regexp(URL, '(.*?)\/(.*?)\/(.*?)\/(.*?)', '$4'), '%20', ' ') as path3
,replace(regexp(URL, '(.*?)\/(.*?)\/(.*?)\/(.*?)\/(.*?)', '$5'), '%20', ' ') as path4
,replace(regexp(URL, '(.*?)\/(.*?)\/(.*?)\/(.*?)\/(.*?)\/(.*?)', '$6'), '%20', ' ') as path5
我想我不太明白某些路径的regexp函数是如何运行的。。。
1条答案
按热度按时间aiazj4mn1#
更好地使用
INSTR
函数,它获取子字符串的n的出现次数。