python 为n个组大小为m的对象生成唯一的组合，而不重复或重复？

djp7away 于 2024-01-05 发布在 Python

关注(0)|答案(1)|浏览(138)

我正在尝试创建一个算法，该算法可以生成组大小为 n 的 m 个对象的所有唯一组合，而无需重复或重复。
重复是指至少有两个或两个以上的数字之前已经组合在一起。例如，[1, 2, 3]和[1, 2, 4]具有对[1, 2]的重复。
如果不使用扩展器，则意味着所有大小为 n 的组必须大小相同。
下面的函数接受一个输入(m, n)，如果 m 和 n 不兼容，则输出False。如果 m 和 n 兼容，则函数返回唯一组合的数量。

def iterations (m, n):
    num = (m**2) - m
    den = (n**2) - n
    if den <= 0 or num <= 0:
        return False
    if (m - 1) % (n - 1) != 0:
        return False
    if num % den != 0:
        return False
    return int(num/den)

字符串
这部分代码工作正常。我遇到的问题是如何实现生成唯一组合的算法。
这是我用来生成唯一组合的代码块：

import random
class id ():
    def __init__(self, name):
        self.name = name
        self.comparisons = []
    def update_comparisons(self, id_list):
        for id in id_list:
            if id in self.comparisons:
                self.comparisons.remove(id)
        self.comparisons.extend(id_list)
        self.comparisons.sort()
        if self.name in self.comparisons:
            self.comparisons.remove(self.name)
        return self.comparisons
def get_ids(n):
    ids = []
    for i in range(1,n+1):
        ids.append(id(i))
    return ids
def iterations(m,n):
    num = (m**2) - m
    den = (n**2) - n
    if den <= 0 or num <= 0:
        return False
    if (m - 1) % (n - 1) != 0:
        return False
    if num % den != 0:
        return False
    return int(num/den)

# Checking if m and n are valid values
m = 9
n = 3
if iterations(m, n):
    iter = iterations(m, n)
    print(iter)

#Creating list of ids
ids_master = get_ids(m)
ids = ids_master.copy()
comparison_names = []
ids = ids_master.copy()
comparisons = []
for i in range(iter):
    temp = []
    pos = 0
    while len(temp) < n:
        id_a = ids[pos]
        # Checking if the id within temp have already been compared or is a duplicate
        counter = 0
        for id_b in temp:
            if id_b.name in id_a.comparisons or id_b.name == id_a.name:
                counter += 1
        # Checking if id_a has been compared to all other ids
        if len(id_a.comparisons) == m - 1:
            counter += 1
        # If id_a has passed the checks, append it to temp_list
        if counter == 0:
            temp.append(id_a)
        pos += 1
    comparisons.append(temp)
    # Updating the comparison for each id object
    for comparison in comparisons:
        names = [x.name for x in comparison]
        names.sort()
    for id in comparison:
        id.update_comparisons(names)
    comparison_names.append(names)

# Checking if all ids have been compared
for id in ids_master:
    print(f'ID: {id.name} \n Comparisons: {id.comparisons}')

上面的代码适用于值（3，2）、（5，2）和（7，3）。然而，（9，3）带来了复杂性。
代码将在遇到路障之前生成以下比较。[[1, 2, 3], [1, 4, 5], [1, 6, 7], [1, 8, 9], [2, 4, 6], [2, 5, 7]]
在这种情况下，下一个组合将是[2, 8, 9]。这不起作用，因为对[8，9]已经在[1, 8, 9]中进行了比较。代码然后继续迭代位置，直到它用完了要检查的列表中的项目，并给出错误“list index out of range”。
我需要一种算法来预测这些错误的方法。例如，如果代码生成[2, 4, 9]，那么剩余的组合 * 可能 * 会正常工作。我相信有一种方法可以实现这一点，但我不确定如何进行。
先谢谢你了！

python

来源：https://stackoverflow.com/questions/77753778/generating-unique-combinations-for-n-objects-of-group-size-m-without-repetitions

1条答案

按热度按时间

li9yvcax1#

我不能完全遵循代码中的逻辑来查看您做错了什么，但我提出了这个似乎可以满足您的要求：

import itertools  # for itertools.combinations
import functools  # for functools.reduce
n=3
m=9
# track a list of valid combinations; a valid combination has
# elements that don't have more than 1 value in common with other
# valid combinations
valid = []
# loop through every possible combination given (m, n)
for combo in itertools.combinations(range(m), n):
    # check each possible combination against every valid combination
    for v in valid:
        if len(v & set(combo)) > 1:
            break  # this combo has more than 1 element in common
    else:
        valid.append(set(combo))
# (m,n) is valid if all members of m are represented in the list of
# valid combinations
if len(functools.reduce(set.union, valid)) == m:
    print(f'({m}, {n}) is valid and produces {len(valid)} combinations')
    print(valid)

个字符

编辑：根据您的评论，为了有效地生成大量的有效组合，这里有一个替代实现。这个版本存储了少量的状态，并根据请求输出有效的组合。它仍然需要花费很长时间来生成所有的m，n = 96，6值，但每个单独的组合都可以执行，而不必计算它们。

import itertools
def valid_combos(m, n):
    seen_pairs = set()  # this will only grow to C(m,2) elements
    # loop through every possible combination given (m, n)
    for combo in itertools.combinations(range(m), n):
        combo_pairs = set()
        for pair in itertools.combinations(combo, 2):
            if pair in seen_pairs:
                break
            combo_pairs.add(pair)
        else:
            seen_pairs |= combo_pairs
            yield combo
for count, combo in enumerate(valid_combos(96, 5), start=1):
    print(combo)
print(f'{count=}')

型
可以通过在生成器中使用多线程或DISC来进行一些优化。可以通过实现itertools.combinations的自定义版本来实现进一步的优化，其中可以将seen_pairs的检查集成到逻辑中，从而避免生成无效组合。

上次编辑：我尝试了一个修改过的itertools.combinations的参考实现，以从输入空间中删除块。下面是m,n=96,6的计时结果。

import itertools
def pruned_combinations(n, r, seen_pairs):
    """modified itertools.combinations reference implementation:
       https://docs.python.org/3/library/itertools.html#itertools.combinations
    """
    if r > n:
        return
    indices = list(range(r))
    yield tuple(indices)
    while True:
        for i in reversed(range(r)):
            if indices[i] != i + n - r:
                break
        else:
            return
        indices[i] += 1
        for j in range(i+1, r):
            indices[j] = indices[j-1] + 1
        # prune, if possible
        for z in range(1, r-2):
            if tuple(indices[z-1:z+1]) in seen_pairs:
                if indices[z] != z+n-r:
                    indices[z] += 1
                    for j in range(z+1, r):
                        indices[j] = indices[j-1] + 1
                break
        else:
            yield tuple(indices)
def valid_combos(m, n):
    seen_pairs = set()  # this will only grow to C(m,2) elements
    for combo in pruned_combinations(m, n, seen_pairs):
        combo_pairs = set(itertools.combinations(combo, 2))
        for pair in combo_pairs:
            if pair in seen_pairs:
                break
        else:
            seen_pairs |= combo_pairs
            yield combo
import timeit
start_time = timeit.default_timer()
for count, combo in enumerate(valid_combos(96, 6), start=1):
    pass
print(f'{count=}')
print(f'time: {timeit.default_timer()-start_time:.2f} seconds')

count=211
time: 32.66 seconds

展开查看全部

赞(0）回复(0）举报 2024-01-05

我来回答

python 为n个组大小为m的对象生成唯一的组合，而不重复或重复？

1条答案

相关问题

热门标签

最新问答