下面是我的字符串-
vdp_plus_forecast_aucc_VDP_20221024_variance_analysis_20221107_backcasting_actuals_asp_True_vlt_True.csv
我需要RegEx从字符串中取出以下项-
20221107 vlt_True
需要帮助为这两个提取编写正确的RegEx。我正在PySpark DF上执行此操作。
s5a0g9ez1#
我假设答案是基于前面的变量的,所以它体现了方差分析的价值:(?<=_variance_analysis_)[0-9]+|vlt_(True|False)这将捕获您需要的变量,如果您只需要vlt的值,则可以将vlt_替换为(?<=_vlt),这样只捕获值而不捕获变量
(?<=_variance_analysis_)[0-9]+|vlt_(True|False)
vlt_
(?<=_vlt)
1条答案
按热度按时间s5a0g9ez1#
我假设答案是基于前面的变量的,所以它体现了方差分析的价值:
(?<=_variance_analysis_)[0-9]+|vlt_(True|False)
这将捕获您需要的变量,如果您只需要vlt的值,则可以将
vlt_
替换为(?<=_vlt)
,这样只捕获值而不捕获变量