我有一个Pandas数据框。我需要一个代码来使用3x3窗口将此 Dataframe 拆分为多个 Dataframe 。
import pandas as pd
d= {1: [5, 5, 5, 5, 4, 6,11,11], 3: [4, 5, 15, 25, 40, 10,25,33],6: [77, 47, 55, 59, 32, 5,9,22],
7: [15, 21, 40, 33, 30, 6,14,14],9: [10, 11, 12, 45, 14, 15,13,76],15: [3, 5, 32, 12, 11, 12,17,45],18: [3, 6, 23, 22, 21, 32,19,65],23: [6, 3, 5, 8, 10, 12,4,2]}
data_miss=pd.DataFrame(data=d)
data_miss.index=[1,3,4,8,10,25,32,40]
请参见下图作为示意图示例:
如上图所示,行和列索引不是按顺序编号的,我需要使用每个提取的 Dataframe 保存行和列索引(请参见图像下方的提取 Dataframe )。此外,代码应该能够考虑数据框的边框,即行或COL中所选数据框的大小小于3,窗口应该考虑它并且不面临错误。
1条答案
按热度按时间sirbozc51#
可以使用两次np.array\u split和双循环:一次拆分行,然后将已拆分的行上的列拆分为3行。