将正则表达式应用于解释程序flume配置中“|”分隔字符串中的第二个单词

ukdjmx9f  于 2021-06-02  发布在  Hadoop
关注(0)|答案(1)|浏览(299)

我的要求是对来自kafka的数据应用正则表达式。
数据如下:

abc|def|mnq|xyz
abc1|def1|mnq1|xyz1
abc2|def2|mnq2|xyz2

我想使用flume解释程序对第一个sting中的第二个单词(def)应用正则表达式。
正则表达式可以用来过滤单词和小数。
有人能帮忙吗。

acruukt9

acruukt91#

下面的python代码匹配所有行中的第二个单词:

import re

# used || to add multilines combine into one string

parent = """abc|def|mnq|xyz||
abc1|def1|mnq1|xyz1||
abc2|def2|mnq2|xyz2"""

pattern = re.compile("\w+\|(.*?)\|\w+", re.MULTILINE)
m = pattern.findall(parent)
print m

哪些输出|

['def', 'def1', 'def2']

注意:用“\”转义“|”。

相关问题