前言
pytorch对一下常用的公开数据集有很方便的API接口,但是当我们需要使用自己的数据集训练神经网络时,就需要自定义数据集,在pytorch中,提供了一些类,方便我们定义自己的数据集合
torch.utils.data.Dataset:所有继承他的子类都应该重写 __len()__ , __getitem()__ 这两个方法
__len()__ :返回数据集中数据的数量
__getitem()__ :返回支持下标索引方式获取的一个数据
torch.utils.data.DataLoader:对数据集进行包装,可以设置batch_size、是否shuf
1