假设我正在使用以下调用:
trainset = torchvision.datasets.ImageFolder(root="imgs/", transform=transform)
trainloader = torch.utils.data.DataLoader(trainset,batch_size=4,shuffle=True,num_workers=1)
据我所知,这将trainset
定义为由文件夹“images”中的所有图像组成,标签由特定的文件夹位置定义。
我的问题是-是否有直接/简单的方法将trainset
定义为该文件夹中图像的子样本?例如,将trainset
定义为每个子文件夹中10张图像的随机样本?
1条答案
按热度按时间6kkfgxo01#
您可以将类
DatasetFolder
(或ImageFolder) Package 在另一个类中以限制数据集:您还可以在
LimitDataset
中的索引和原始数据集中的索引之间定义一些Map,以定义更复杂的行为(例如随机子集)。如果要限制每个时段的批处理数而不是数据集大小:
请注意,如果您使用此随机化,数据集大小将保持不变,但每个时期看到的数据将受到限制。如果您不随机化数据集,这也将限制数据集大小。