我有一个包含3个类的数据集,下面是value_counts()。
Class 0 - 2000
Class 1 - 10000
Class 2 - 10000
我想用下面的分布对这个数据集进行抽样。
Class 0 - 2000 (i.e., all rows from Class 0)
Class 1 - 4000 (i.e., twice as many rows as Class 0)
Class 2 - 4000 (i.e., twice as many rows as Class 0)
使用权重的随机抽样仅检索0类的一小部分。请提供建议。
1条答案
按热度按时间xxhby3vn1#
如果我没理解错的话: