perl 替换字符组合

dy2hfwbg  于 2023-03-03  发布在  Perl
关注(0)|答案(4)|浏览(146)

我有一个字符串27AAGCB5913L2ZF,如果字符串中出现AJK中的任何一个,那么我需要将它们更改为这三个字母的所有可能组合,如果我将上面的字符串输入传递给程序,那么输出应该是这样的

27AAGCB5913L2ZF
27AJGCB5913L2ZF
27AKGCB5913L2ZF
27JAGCB5913L2ZF
27KAGCB5913L2ZF
27KJGCB5913L2ZF
27JKGCB5913L2ZF
27JJGCB5913L2ZF
27KKGCB5913L2ZF

这些字母可以出现在字符串中的任何位置。如果只出现一个字母,则必须依次替换为AJK。例如,字符串27ABGCB5913L2ZF的输出应如下所示

27ABGCB5913L2ZF
27JBGCB5913L2ZF
27kBGCB5913L2ZF

我可以用这样的代码搜索给定的字符

while ( $string =~ /(B)/g ) {
    say $1, ' at ', pos $string;
}

如果在任何位置都可以有任意数量的AJK,我如何生成所有可能的字符串?

slwdgvem

slwdgvem1#

你想要的关键字母AJK的组合集合叫做Cartesian product,在Python中,你可以使用itertools.product来生成它们。
首先,我们需要找到输入字符串中所有关键字母的位置,最简单的方法是使用内置的enumerate函数,一旦知道了这些位置,以及字符串包含多少个关键字母,我们就可以生成笛卡尔积的每一项,替换关键字母,并打印新的字符串。
在Python中,字符串是不可变的(它们不能被改变),所以我将字符串转换为字符列表,替换关键位置的字符,然后使用str.join方法从列表中构建一个新的字符串。
以下代码适用于Python版本2和3

巨蟒

from itertools import product

def make_patterns(s):

    keyletters = 'AJK'

    # Convert input string into a list so we can easily substitute letters
    seq = list(s)

    # Find indices of key letters in seq
    indices = [ i for i, c in enumerate(seq) if c in keyletters ]

    # Generate key letter combinations & place them into the list
    for t in product(keyletters, repeat=len(indices)):
        for i, c in zip(indices, t):
            seq[i] = c
        print(''.join(seq))

# Test

data = (
    '1ABC2',
    '27AAGCB5913L2ZF',
    '3A4J',
    '5K67KA',
)

for s in data:
    print('\nInput:', s)
    make_patterns(s)

输出

Input: 1ABC2
1ABC2
1JBC2
1KBC2

Input: 27AAGCB5913L2ZF
27AAGCB5913L2ZF
27AJGCB5913L2ZF
27AKGCB5913L2ZF
27JAGCB5913L2ZF
27JJGCB5913L2ZF
27JKGCB5913L2ZF
27KAGCB5913L2ZF
27KJGCB5913L2ZF
27KKGCB5913L2ZF

Input: 3A4J
3A4A
3A4J
3A4K
3J4A
3J4J
3J4K
3K4A
3K4J
3K4K

Input: 5K67KA
5A67AA
5A67AJ
5A67AK
5A67JA
5A67JJ
5A67JK
5A67KA
5A67KJ
5A67KK
5J67AA
5J67AJ
5J67AK
5J67JA
5J67JJ
5J67JK
5J67KA
5J67KJ
5J67KK
5K67AA
5K67AJ
5K67AK
5K67JA
5K67JJ
5K67JK
5K67KA
5K67KJ
5K67KK

只要做一点小改动,我们就可以把函数变成一个生成器,这样你就可以轻松地循环输出字符串,或者把它们变成一个列表。

巨蟒

from itertools import product

def make_patterns(s):

    keyletters = 'AJK'

    # Convert input string into a list so we can easily substitute letters
    seq = list(s)

    # Find indices of key letters in seq
    indices = [i for i, c in enumerate(seq) if c in keyletters]

    # Generate key letter combinations & place them into the list
    for t in product(keyletters, repeat=len(indices)):
        for i, c in zip(indices, t):
            seq[i] = c
        yield ''.join(seq)

# Test

print(list(make_patterns('A12K')))

for s in make_patterns('3KJ4'):
    print(s)

输出

['A12A', 'A12J', 'A12K', 'J12A', 'J12J', 'J12K', 'K12A', 'K12J', 'K12K']
3AA4
3AJ4
3AK4
3JA4
3JJ4
3JK4
3KA4
3KJ4
3KK4
vom3gejh

vom3gejh2#

这可以在Perl中通过使用glob操作符来完成。glob用于查找匹配的文件,但是如果模式中不包含通用通配符(*?[...]),则它将只返回所有可能的匹配项,而不管它们是否作为文件存在
这个Perl代码使用一个替换来形成一个glob模式,方法是用多重模式{A,J,K}替换所有出现的AJK

use strict;
use warnings 'all';
use feature 'say';

for my $s ( qw/ 27AAGCB5913L2ZF 27KBGCB5913L2ZF / ) {

    (my $patt = $s) =~ s/[AJK]/{A,J,K}/g;

    say for glob $patt;
    say "";
}

输出

27AAGCB5913L2ZF
27AJGCB5913L2ZF
27AKGCB5913L2ZF
27JAGCB5913L2ZF
27JJGCB5913L2ZF
27JKGCB5913L2ZF
27KAGCB5913L2ZF
27KJGCB5913L2ZF
27KKGCB5913L2ZF

27ABGCB5913L2ZF
27JBGCB5913L2ZF
27KBGCB5913L2ZF
wnrlj8wa

wnrlj8wa3#

一个简短的解决方案:
首先将字符串拆分为可能出现在每个位置的字符元组

>>> s = "27AAGCB5913L2ZF"
>>> p2 = [("A","J","K") if c in "AJK" else (c,) for c in s]
>>> p2
[('2',), ('7',), ('A', 'J', 'K'), ('A', 'J', 'K'), ('G',), ('C',), ('B',), ('5',), ('9',), ('1',), ('3',), ('L',), ('2',), ('Z',), ('F',)]

然后这个函数将把元组列表重新组合成一个字符串:

def assemble(t, s=''):
    if t:
        for c in t[0]:
            assemble(t[1:], s+c)
    else:
        print(s)

>>> assemble(p2)
27AAGCB5913L2ZF
27AJGCB5913L2ZF
27AKGCB5913L2ZF
27JAGCB5913L2ZF
27JJGCB5913L2ZF
27JKGCB5913L2ZF
27KAGCB5913L2ZF
27KJGCB5913L2ZF
27KKGCB5913L2ZF
bkhjykvo

bkhjykvo4#

下面是Perl中的递归解决方案:

my $str = '27AAGCB5913L2ZF';
my @replace = qw (A J K);
print_string( $str);

sub print_string {
    my ( $str, $replace, $start) = @_;

    if (defined $replace) {
        substr( $str, $start, 1) = $replace;
    }
    else {
        $start = -1;
    }
    pos( $str) = $start +1;
    if ($str =~ /\G.*?(A|J|K)/g) {
        my $cur_start = $-[-1];
        print_string( $str, $_, $cur_start) for @replace;
    }
    else {
        say $str;
    }
}
    • 输出**:
27AAGCB5913L2ZF
27AJGCB5913L2ZF
27AKGCB5913L2ZF
27JAGCB5913L2ZF
27JJGCB5913L2ZF
27JKGCB5913L2ZF
27KAGCB5913L2ZF
27KJGCB5913L2ZF
27KKGCB5913L2ZF

相关问题