将正则表达式应用于解释程序flume配置中“|”分隔字符串中的第二个单词

ukdjmx9f 于 2021-06-02 发布在 Hadoop

关注(0)|答案(1)|浏览(300)

我的要求是对来自kafka的数据应用正则表达式。
数据如下：

abc|def|mnq|xyz
abc1|def1|mnq1|xyz1
abc2|def2|mnq2|xyz2

我想使用flume解释程序对第一个sting中的第二个单词（def）应用正则表达式。
正则表达式可以用来过滤单词和小数。
有人能帮忙吗。

hadoop flume regex Interceptor

来源：https://stackoverflow.com/questions/40174574/apply-regular-expression-to-the-second-word-in-separated-string-in-a-interpr

1条答案

按热度按时间

acruukt91#

下面的python代码匹配所有行中的第二个单词：

import re

# used || to add multilines combine into one string

parent = """abc|def|mnq|xyz||
abc1|def1|mnq1|xyz1||
abc2|def2|mnq2|xyz2"""

pattern = re.compile("\w+\|(.*?)\|\w+", re.MULTILINE)
m = pattern.findall(parent)
print m

哪些输出|

['def', 'def1', 'def2']

注意：用“\”转义“|”。

赞(0）回复(0）举报 2021-06-02

我来回答

将正则表达式应用于解释程序flume配置中“|”分隔字符串中的第二个单词

1条答案

相关问题

热门标签

最新问答