我们正在尝试使用pig query筛选hdfs数据。我们将数据括在双引号内。例如:“aaa”、“bbb”、“yyy”。在尝试筛选yyy的过程中,我们尝试了以下筛选方法,
FILTER a BY XXX == 'YYY'; FILTER a BY XXX == '.*YYY.*'; FILTER a BY XXX == '\'\YYY\"\';
期待你的帮助。
wyyhbhjk1#
看起来您正在尝试使用正则表达式。在这种情况下,你有一些问题。你需要使用 MATCHES 而不是 == ,则必须匹配整个字符串,而不仅仅是子字符串,并且在使用元字符时,必须转义反斜杠,就像任何java字符串一样: \\d 匹配一个数字,而不是 \d .
MATCHES
==
\\d
\d
1条答案
按热度按时间wyyhbhjk1#
看起来您正在尝试使用正则表达式。在这种情况下,你有一些问题。你需要使用
MATCHES
而不是==
,则必须匹配整个字符串,而不仅仅是子字符串,并且在使用元字符时,必须转义反斜杠,就像任何java字符串一样:\\d
匹配一个数字,而不是\d
.