什么是MNIST数据集?MNIST数据集加载和绘制操作

发布:2022-11-03 14:50:40
阅读:4083
作者:网络整理
分享:复制链接

MNIST数据集包含70000个规格为28x28的手写数字图像,每个像素被编码为1(白色)到255(黑色)的整数,这些图像是从0到9的集合,其中60000个用于训练,10000个用于测试。它是图像处理领域非常流行的数据集。通常也被用于对机器学习算法进行基准测试。

MNIST是由LeCun、Cortes和Burges开发的数据集,用于评估手写数字分类问题的机器学习模型。MNIST数据集的数据以非常简单的文件格式存储,专为存储向量和多维矩阵而设计。它是公开可用的,虽然包含了大量数据,不过只需要很少的预处理。

在通常情况下,我们可以使用Keras库输出MNIST数据集,再通过matplotlib库显示对应的图像。

使用Keras库加载MNIST数据集

from keras.datasets import mnist

#加载数据
(train_X,train_y),(test_X,test_y)=mnist.load_data()

#输出图像
print('X_train:'+str(train_X.shape))
print('Y_train:'+str(train_y.shape))
print('X_test:'+str(test_X.shape))
print('Y_test:'+str(test_y.shape))

使用matplotlib库绘制MNIST数据集

from matplotlib import pyplot
for i in range(9):
pyplot.subplot(330+1+i)
pyplot.imshow(train_X<i>,cmap=pyplot.get_cmap('gray'))
pyplot.show()

结果如下图:

MNIST数据集示例

扫码进群
微信群
免费体验AI服务