在学习和创建新模型的过程中需要一些数据集来测试效果,当然可以使用一些比较著名的开发数据集如ImgageNet、MSCOCO、PASCAL等,但是他们太庞大了,动辄几十个G,我们这里列举一些小巧的数据集.
keras可以很容易导入这些数据https://keras.io/datasets/
28x28的灰度图片,0~9的数字共10类
训练集样本:60,000
测试集样本:10,000
大小:10M
http://yann.lecun.com/exdb/mnist/
32x32的彩色图片,共10类.
训练集样本:50000
测试集样本:10000
http://www.cs.toronto.edu/~kriz/cifar.html
大小:170 MB
28x28的灰度图片,共10类
训练集样本:60,000
测试集样本:10,000
大小:30M
https://github.com/zalandoresearch/fashion-mnist
3 speakers
1,500 recordings (50 of each digit per speaker)
https://github.com/Jakobovski/free-spoken-digit-dataset
参考:
https://zhuanlan.zhihu.com/p/35399323