numpy 在DF中 Bootstrap 每个列,并将列值替换为 Bootstrap 样本

lqfhib0f  于 2022-12-23  发布在  Bootstrap
关注(0)|答案(1)|浏览(137)

我希望对 Dataframe 中的每列进行1000次 Bootstrap ,然后用1000个 Bootstrap 样本替换每列中的少数值,所以每列现在有1000行,有人知道我该怎么写吗,所以从顶部的 Dataframe 开始,我得到了底部的 Dataframe ,包含了1000个采样值。谢谢大家!
| 第1栏|第2栏。|
| - ------| - ------|
| 1. |三、|
| 4. |五、|
| 7. |一、|
| 1. |九、|
| 第1栏|第2栏。|
| - ------| - ------|
| 1. |三、|
| 4. |五、|
| 1. |五、|
| 7. |一、|
| 1. |九、|
| 1. |一、|
| 1. |五、|
| 7. |一、|
| ... n = 1000| ... n = 1000|

ivqmmu1c

ivqmmu1c1#

假设您要对Col1和Col2独立随机采样,并进行替换:

n = 1000

import numpy as np

out = (df[['Col 1.']]
       .sample(n=n, replace=True, ignore_index=True)
       .assign(**{'Col 2.': np.random.choice(df['Col 2.'], size=n, replace=True)})
      )

print(out)

输出:

Col 1.  Col 2.
0       7.0     1.0
1       1.0     5.0
2       1.0     9.0
3       1.0     1.0
4       7.0     9.0
..      ...     ...
995     1.0     5.0
996     4.0     9.0
997     4.0     9.0
998     1.0     1.0
999     4.0     9.0

[1000 rows x 2 columns]

相关问题