机器学习中的向量范数 L1范数、L2范数、L∞范数

发布:2022-11-08 15:46:07
阅读:6804
作者:网络整理
分享:复制链接

向量范数被定义为向量的长度或大小,一般用于评估模型的误差,在机器学习和深度学习中很重要。

机器学习的项目都可以被认为是一个n维向量,其中维度是数据中的属性。因此,向量表示可以使用标准的基于向量的相似性度量来计算之间的距离,例如曼哈顿距离、欧几里得距离等。换句话说,范数是一类使我们能够量化向量大小的函数。

向量范数的性质

向量范数满足以下4种性质:

  • 非负性:始终是非负的。
  • 确定性:零向量时,它才为零
  • 三角不等式:两个向量之和的范数不超过它们的范数之和。
  • 同质性:将向量乘以标量将向量的范数乘以标量的绝对值。

机器学习中常见的向量范数

L1范数

L1范数的符号是||v||1计算从原点到向量空间的曼哈顿距离,L1范数是计算绝对向量值的总和。在机器学习中,我们通常在向量的稀疏性很重要时使用L1范数。

公式:||v||1= |b1|+ |b2|+|b3|

L2范数

L2范数的符号是||v||2这种范数也称为欧几里得范数,L2范数计算为向量平方值之和的平方根,由于是可微函数,L2范数最常用于机器学习中的优化。

公式:||v||2= sqrt [ (b1)2+ (b2)2+ (b3)2]

向量最大范数

最大范数的符号是||v||inf,也可以用无穷大符号表示L∞,最大范数被计算为返回向量的最大值。

公式:||v||inf= max( |b1| , |b2| , |b3| )

许多应用程序,如信息检索、个性化、文档分类、图像处理等,都依赖于项目之间相似性或不相似性的计算。如果两个项目之间的距离较小,则认为两个项目相似,反之亦然。

扫码进群
微信群
免费体验AI服务