在学习和创建新模型的过程中需要一些数据集来测试效果,当然可以使用一些比较著名的开发数据集如ImgageNet、MSCOCO、PASCAL等,但是他们太庞大了,动辄几十个G,我们这里列举一些小巧的数据集.

keras可以很容易导入这些数据https://keras.io/datasets/

MNIST

28x28的灰度图片,0~9的数字共10类
训练集样本:60,000
测试集样本:10,000
大小:10M

http://yann.lecun.com/exdb/mnist/

CIFAR-10

32x32的彩色图片,共10类.
训练集样本:50000
测试集样本:10000

http://www.cs.toronto.edu/~kriz/cifar.html

大小：170 MB

28x28的灰度图片,共10类
训练集样本:60,000
测试集样本:10,000
大小:30M

https://github.com/zalandoresearch/fashion-mnist

3 speakers
1,500 recordings (50 of each digit per speaker)

https://github.com/Jakobovski/free-spoken-digit-dataset

参考:
https://zhuanlan.zhihu.com/p/35399323