我的要求是对来自kafka的数据应用正则表达式。数据如下:
abc|def|mnq|xyz abc1|def1|mnq1|xyz1 abc2|def2|mnq2|xyz2
我想使用flume解释程序对第一个sting中的第二个单词(def)应用正则表达式。正则表达式可以用来过滤单词和小数。有人能帮忙吗。
acruukt91#
下面的python代码匹配所有行中的第二个单词:
import re # used || to add multilines combine into one string parent = """abc|def|mnq|xyz|| abc1|def1|mnq1|xyz1|| abc2|def2|mnq2|xyz2""" pattern = re.compile("\w+\|(.*?)\|\w+", re.MULTILINE) m = pattern.findall(parent) print m
哪些输出|
['def', 'def1', 'def2']
注意:用“\”转义“|”。
1条答案
按热度按时间acruukt91#
下面的python代码匹配所有行中的第二个单词:
哪些输出|
注意:用“\”转义“|”。