什么是自动编码器 自动编码器是如何处理图像的

发布:2022-10-28 15:52:45
阅读:5730
作者:网络整理
分享:复制链接

自动编码器是一种特定类型的前馈神经网络,其输入和输出是相同的。Geoffrey Hinton在1980年代设计了自动编码器来解决无监督学习问题。它们是经过训练的神经网络,可将数据从输入层复制到输出层。自动编码器可以用于图像处理。

自动编码器工作原理

自动编码器由三个主要部分组成:编码器、潜在特征表示和解码器。

自动编码器被构造为接收输入并将其转换为不同的表示,并尝试尽可能准确地重建原始输入。

当一个数字的图像不清晰可见时,它会馈送到自动编码器神经网络。自动编码器首先对图像进行编码,然后将输入的大小减小为更小的表示形式。

最后,自动编码器对图像进行解码以生成重建图像。

下图演示了自动编码器的操作方式:

自动编码器的操作方式

自动编码器类型

1、传统自动编码器

自动编码器其实就是非常简单的神经结构。它们大体上是一种压缩形式,类似于使用MP3压缩音频文件或使用jpeg压缩图像文件。

2、去噪自动编码器

在训练前给数据添加一些白噪声,但在训练时会将误差与原始图像进行比较。这就使得网络不会过度拟合图像中出现的任意噪声。稍后,将使用它来清除文档扫描图像中的折痕和暗黑区域。

3、稀疏自动编码器

稀疏自动编码器具有比输入或输出维度更大的潜在维度。然而,每次网络运行时,只有很小一部分神经元会触发,这意味着网络本质上是“稀疏”的。稀疏自动编码器也是通过一种规则化的形式来减少网络过度拟合的倾向,这一点与去噪自动编码器相似。

4、收缩自动编码器

收缩编码器与前两个自动编码器的运行过程基本相同,但是在收缩自动编码器中,我们不改变结构,只是在丢失函数中添加一个正则化器。这可以被看作是岭回归的一种神经形式。

扫码进群
微信群
免费体验AI服务