MNIST数据集包含70000个规格为28x28的手写数字图像,每个像素被编码为1(白色)到255(黑色)的整数,这些图像是从0到9的集合,其中60000个用于训练,10000个用于测试。它是图像处理领域非常流行的数据集。通常也被用于对机器学习算法进行基准测试。
MNIST是由LeCun、Cortes和Burges开发的数据集,用于评估手写数字分类问题的机器学习模型。MNIST数据集的数据以非常简单的文件格式存储,专为存储向量和多维矩阵而设计。它是公开可用的,虽然包含了大量数据,不过只需要很少的预处理。
在通常情况下,我们可以使用Keras库输出MNIST数据集,再通过matplotlib库显示对应的图像。
使用Keras库加载MNIST数据集
from keras.datasets import mnist
#加载数据
(train_X,train_y),(test_X,test_y)=mnist.load_data()
#输出图像
print('X_train:'+str(train_X.shape))
print('Y_train:'+str(train_y.shape))
print('X_test:'+str(test_X.shape))
print('Y_test:'+str(test_y.shape))
使用matplotlib库绘制MNIST数据集
from matplotlib import pyplot
for i in range(9):
pyplot.subplot(330+1+i)
pyplot.imshow(train_X<i>,cmap=pyplot.get_cmap('gray'))
pyplot.show()
结果如下图: