numpy数组中的值组除以N个连续K个值的索引

4sup72z8 于 2023-08-05 发布在其他

关注(0)|答案(1)|浏览(112)

假设我有一个这样的数组：

numpy.array([0, 0, 1, 2, 3, 0, 0, 4, 5, 0, 0, 0, 0, 1, 0, 6, 0, 7, 8, 9, 0, 0, 0, 8, 10, 0])

字符串
定义一个长度（N）和一个值（K），我想确定一系列的值（包括零），这些值被彼此除以至少N个连续的K，每个块的开始和停止索引。
因此，与：

N = 2
K = 0

型
我们最终将得到：

#blocks
[ [1, 2, 3], [4, 5], [1, 0, 6, 0, 7, 8, 9], [8, 10] ]

#indexes
[ [2, 4], [7, 8], [13, 19], [23, 24] ]

的字符串
在该示例中，块3（索引为2）还包含0，即所选择的K值，因为没有足够的连续出现（至少N个）来标识两个独立块。
实现这种避免循环的最聪明的方法是什么？
现在我采用了这种方法：

def consecutive_blocks(arr,K,N):
   d = numpy.diff(numpy.concatenate(([False], arr==K, [False])).astype(int))
   idx_i = numpy.flatnonzero(d == -1)[:-1]
   idx_j = numpy.flatnonzero(d == 1)[1:] - 1
   
   delta = numpy.flatnonzero(d == -1) - numpy.flatnonzero(d == 1)
   
   idx_ii = idx_i[numpy.where(delta >= N)[0]]
   
   return idx_ii

型
这样我就得到了块的起始索引，但是我还需要进一步的工作来得到结束索引。

numpy

来源：https://stackoverflow.com/questions/76794649/indexing-of-groups-of-values-divided-by-n-consecutives-k-values-in-numpy-array

1条答案

按热度按时间

mwg9r5ms1#

这里有一个方法：

import numpy as np
A = np.array([0, 0, 1, 2, 3, 0, 0, 4, 5, 0, 0, 0, 0, 1, 0, 6, 0, 7, 8,
              9, 0, 0, 0, 8, 10, 0])
N = 2
K = 0
b = np.tile(A,N+1)[:N*(A.size+1)].reshape((N,A.size+1)).T
c = np.where(np.all(b[:A.size-N+1]==[K]*N,axis=1))[0]
c = np.concatenate(([-N],c,[A.size]))
d = np.stack((c[:-1]+N,c[1:]-1)).T
e = d[d[:,0]<=d[:,1]]
print(e)
[[ 2  4]
 [ 7  8]
 [13 19]
 [23 25]]   # last zero included (doesn't form a [0,0])

字符串

b创建一个2D矩阵，其中每行对应于长度为N的值的滚动子范围。
c查找与K重复N次模式匹配的行的索引。这给出了[0，0]子范围的起始位置。添加表示数组开始和结束的索引以完成边缘范围。
d将每个起始位置与下一个起始位置组合以形成索引范围。开始索引增加N以获得第一个非K值，并且接下来的开始减少1以获得组中最后一个项目的索引。
e消除了由多于N个连续K值的序列引起的“空”范围。

根据下面的注解，可以通过更改前两行来利用as_strided或sliding_window_view（* 我只能测试as_strided*）来获得更好的性能：

b = np.lib.stride_tricks.as_strided(A,   shape=(len(A)-N+1,N),
                                       strides=A.strides*2)
c = np.where(np.all(b==[K]*N,axis=1))[0]

型
中间值：

# b[:A.size-N+1] : rolling subranges of length N
array([[ 0,  0],
       [ 0,  1],
       [ 1,  2],
       [ 2,  3],
       [ 3,  0],
       [ 0,  0],
       [ 0,  4],
       [ 4,  5],
       [ 5,  0],
       [ 0,  0],
       [ 0,  0],
       [ 0,  0],
       [ 0,  1],
       [ 1,  0],
       [ 0,  6],
       [ 6,  0],
       [ 0,  7],
       [ 7,  8],
       [ 8,  9],
       [ 9,  0],
       [ 0,  0],
       [ 0,  0],
       [ 0,  8],
       [ 8, 10],
       [10,  0]])

型
...

# c : starting index of [K]*N patterns (and edges)
array([-2,  0,  5,  9, 10, 11, 20, 21, 25, 26])

型
...

# d : subranges between [K]*N patterns (including empties)
array([[ 0, -1],
       [ 2,  4],
       [ 7,  8],
       [11,  9],
       [12, 10],
       [13, 19],
       [22, 20],
       [23, 25]])

型

展开查看全部

赞(0）回复(0）举报 2023-08-05

我来回答

numpy数组中的值组除以N个连续K个值的索引

1条答案

相关问题

热门标签

最新问答