详解卷积神经网络（CNN）

发布：2022-10-19 14:46:56

阅读：7345

作者：网络整理

卷积神经网络（CNN）常用于图像分类和对象识别，并提供了一种更具扩展性的方法，利用线性代数的原理，特别是矩阵乘法，来识别图像。

卷积神经网络与其他神经网络的区别在于其在图像、语音或音频信号输入方面的卓越性能。

卷积神经网络3个主要类型层

分别是卷积层、池化层和全连接层。

1、卷积层

卷积层是CNN最重要的组成部分，因为它是进行大部分处理的地方。它需要输入数据、过滤器和特征图等。

让我们假设输入是一张彩色图片，它由一个3D像素矩阵组成。这意味着输入将具有三个维度：高度、宽度和深度，它们与图片的RGB颜色空间相匹配。在这里，我们尝试将RGB分解为多维层，并对每一层应用过滤器。

特征检测器，也称为内核或过滤器，将遍历图像的感受野，检查特征的存在。跨步器用于跨步到图像中的每个矩阵。我们尝试使用卷积跨步器来理解这些图像。

2、池化层

池化层是一种降维技术，可以减少输入参数的数量。池化过程像卷积层一样在输入中扫描过滤器。但是，与卷积层不同，此过滤器不包含任何权重。

相反，内核使用聚合函数从接受域中的值填充输出数组。池化层也称为下采样过程。并且，最大池化和平均池化是池化的两种基本形式。

3、全连接层

全连接层的名称是对它的完美描述。如前所述，对于部分连接的层，输入图像的像素值不直接连接到输出层。

但是，输出层中的每个节点都直接链接到全连接层中前一层的节点。该层根据前面层检索到的特征和应用于它们的过滤器进行分类。

虽然卷积层和池化层通常使用ReLu函数对输入进行分类，但FC层通常使用softmax激活函数来提供从0到1的概率。

卷积神经网络的过滤器、感受野、步幅和填充

1、过滤器

卷积神经网络中的滤波器通过检测图片强度值的变化来识别空间模式，例如图像中的边缘。

2、感受野

感受野是空间或空间结构的指定区域，包括为层的单元集合提供输入的单元。卷积神经网络中层的滤波器大小决定了感受野。

3、步幅

内核的步幅是它穿过输入矩阵的像素数。尽管两个或更多的步幅值并不常见，但更大的步幅会导致更少的输出。

4、填充

填充本质上增加了卷积神经网络可以处理的图像数量。每个像素在经过图片时由内核/过滤器扫描，将图像转换为较小的图像。

卷积神经网络的步骤

使用MLP创建模型，到卷积层，再激活池化层，再到全连接层，最后是卷积神经网络模型编译和训练。

卷积神经网络的优点

图像识别问题的非常高的准确性。并且无需人工监督。

卷积神经网络的局限性

卷积神经网络(CNN)在对与数据集非常相似的图像进行分类时具有出色的性能。但是，如果图像包含某种程度的倾斜或旋转，那么CNN通常难以对图像进行分类。如果CNN包含多个层，没有强大的GPU，训练过程将需要很长时间。而且为了分析和训练神经网络，需要庞大的数据集。

人工神经网络

大模型的低秩适应

大模型的低秩适应旨在通过用低维结构近似大型模型的高维结构来降低其复杂性。具体来说，这种方法旨在创建一个更小、更易于管理的原始模型表示，该表示仍然可以很好地执行特定的任务。

2023-12-29 14:42:38

使用Python中的合成数据集理解并实现残差神经网络

残差神经网络（ResNet）是由微软研究院的何凯明人提出的一种深度神经网络架构，通过使用残差块来解决深层网络的缺口等问题。在残差块中，通过引入跳跃连接，能够使网络学习残差，从而更轻松地训练出非常深的神经网络。

2023-12-27 15:18:06

基于树的算法在哪些情况下会优于神经网络？

基于树的算法和神经网络各有优势。基于树的算法在可解释性、处理离散特征、小型数据集和强调鲁棒性的情况下表现更优。

2023-12-22 14:41:46

微调大型语言模型（LLM）的数据注释

大型语言模型（LLM）的微调是指使用特定领域的数据对预训练模型进行再训练，以使其适应特定任务或领域。数据注释是微调过程中至关重要的一部分，它涉及将数据标记为模型需要理解的特定信息。

2023-12-19 10:25:22

LLM大语言模型和检索增强生成

LLM大语言模型通常采用Transformer架构，并通过大量文本数据进行训练。它们可以理解和生成自然语言，被广泛应用于聊天机器人、文本摘要、机器翻译等领域。知名的LLM大语言模型包括OpenAI的GPT系列、谷歌的BERT等。

2023-12-06 10:31:45

神经网络遗传算法在函数极值寻优

神经网络遗传算法函数极值寻优是一种基于遗传算法和神经网络的优化算法。它利用神经网络来逼近目标函数，并使用遗传算法来搜索最优解。相比于其他优化算法，神经网络遗传算法具有更好的全局搜索能力和鲁棒性，可以有效地解决复杂的非线性函数极值问题。

2023-12-01 10:11:24

基于双向LSTM模型的文本分类示例

双向LSTM模型是一种神经网络模型，可以用于文本分类任务。以下是一个简单的示例，说明如何使用双向LSTM模型进行文本分类。

2023-11-15 10:12:59

inception模块是什么，它有什么作用？

Inception模块是一种高效的特征提取器，它能够在保证计算效率的前提下，增加网络的深度和宽度，提高网络的准确率和泛化能力。同时，通过使用不同尺度的卷积核，Inception模块能够在不同空间尺度上对输入数据进行特征提取，适应于各种不同类型的数据。此外，Inception模块还可以通过减少参数数量来减少模型的复杂度，防止过拟合现象的发生。本文就来详细介绍一下Inception模块。

2023-11-15 10:06:07

误差反向传播的概念和步骤

误差反向传播法，也称为Backpropagation算法，是一种常用于训练神经网络的方法。它利用链式法则，通过计算神经网络输出和标签之间的误差，将误差逐层反向传播到每个节点，从而计算出每个节点的梯度。这些梯度可以用来更新神经网络的权重和偏置，使网络逐渐接近最优解。

2023-11-10 10:04:50

基于卷积神经网络的图像去噪

卷积神经网络在图像去噪任务中表现出色，其原理是通过学习到的滤波器对噪声进行过滤，从而恢复出原始图像。本篇文章将详细介绍基于卷积神经网络的图像去噪方法。

2023-11-06 10:33:30