深度神经网络模型最初受到神经生物学的启发。生物神经元通过接触其树突的突触接收多个信号,并通过其轴突发送单个动作电位流。通过对输入模式进行分类,可以降低多个输入的复杂性。受这种直觉的启发,人工神经网络模型由组合多个输入并产生单个输出的单元组成。
深度神经网络在神经网络中采用深度架构。“深”是指单层中层数和单元复杂度较高的函数。在云管理大型数据集的能力使得通过使用额外的更大的层来捕获更高级别的模式来构建更准确的模型成为可能。
神经网络的两个关键阶段称为训练和预测,它们对标的是开发阶段与生产应用。在创建深度网络系统的架构时,开发者选择层数和神经网络类型,训练决定权重。
3种深度神经网络
现如今3种常用类型的深度神经网络:多层感知器(MLP)、卷积神经网络(CNN)、循环神经网络(RNN)。
1、多层感知器(MLP)
多层感知器(MLP)是一类前馈人工神经网络。MLPs模型是最基本的深度神经网络,由一系列全连接层组成。如今,MLP机器学习方法可用于克服现代深度学习架构对高计算能力的要求。
每个新层都是前一层的所有输出(全连接)的加权和的一组非线性函数。
2、卷积神经网络(CNN)
卷积神经网络(CNN)是另一类深度神经网络。CNN最常用于计算机视觉。给定一系列来自现实世界的图像或视频,利用CNN,人工智能系统学习自动提取这些输入的特征以完成特定任务,例如图像分类、人脸认证和图像语义分割。
与MLP中的全连接层不同,在CNN模型中,一个或多个卷积层通过执行卷积操作从输入中提取简单特征。每一层都是一组非线性函数,它们是在前一层的空间邻近输出子集的不同坐标处的加权和,这允许重用权重。
应用各种卷积滤波器,CNN机器学习模型可以捕获输入数据的高级表示,使CNN技术在计算机视觉任务中广泛流行。卷积神经网络示例应用包括图像分类和对象检测。
随着技术发展,CNN应用于AI视觉任务的性能逐渐提高,现已超过了人类视觉。
3、循环神经网络(RNN)
循环神经网络(RNN)是另一类使用顺序数据馈送的人工神经网络。RNN已被开发用于解决顺序输入数据的时间序列问题。
RNN的输入由当前输入和之前的样本组成。因此,节点之间的连接形成了一个沿时间序列的有向图。此外,RNN中的每个神经元都拥有一个内部存储器,用于保存来自先前样本的计算信息。
由于处理输入长度不固定的数据的优越性,RNN模型被广泛用于自然语言处理(NLP)。人工智能在这里的任务是建立一个可以理解人类所说的自然语言的系统,例如自然语言建模、词嵌入和机器翻译。
在RNN中,每个后续层都是输出和前一个状态的加权和的非线性函数的集合。因此,RNN的基本单元称为“单元”,每个单元由层和一系列单元组成,这些单元能够对循环神经网络模型进行顺序处理。
机器学习技术已广泛应用于模式识别、自然语言处理和计算学习等各个领域。在过去的几十年里,机器学习给我们的日常生活带来了巨大的影响,例如高效的网络搜索、自动驾驶系统、计算机视觉和光学字符识别(OCR)。
尤其是深度神经网络算法模型已成为机器学习和人工智能技术的主要工具。