pyspark 从字符串中提取特定信息的正则表达式

cigdeys3  于 2022-11-21  发布在  Spark
关注(0)|答案(1)|浏览(118)

下面是我的字符串-

vdp_plus_forecast_aucc_VDP_20221024_variance_analysis_20221107_backcasting_actuals_asp_True_vlt_True.csv

我需要RegEx从字符串中取出以下项-

20221107
vlt_True

需要帮助为这两个提取编写正确的RegEx。我正在PySpark DF上执行此操作。

s5a0g9ez

s5a0g9ez1#

我假设答案是基于前面的变量的,所以它体现了方差分析的价值:
(?<=_variance_analysis_)[0-9]+|vlt_(True|False)
这将捕获您需要的变量,如果您只需要vlt的值,则可以将vlt_替换为(?<=_vlt),这样只捕获值而不捕获变量

相关问题