向量范数被定义为向量的长度或大小,一般用于评估模型的误差,在机器学习和深度学习中很重要。
机器学习的项目都可以被认为是一个n维向量,其中维度是数据中的属性。因此,向量表示可以使用标准的基于向量的相似性度量来计算之间的距离,例如曼哈顿距离、欧几里得距离等。换句话说,范数是一类使我们能够量化向量大小的函数。
向量范数的性质
向量范数满足以下4种性质:
- 非负性:始终是非负的。
- 确定性:零向量时,它才为零
- 三角不等式:两个向量之和的范数不超过它们的范数之和。
- 同质性:将向量乘以标量将向量的范数乘以标量的绝对值。
机器学习中常见的向量范数
L1范数
L1范数的符号是||v||1计算从原点到向量空间的曼哈顿距离,L1范数是计算绝对向量值的总和。在机器学习中,我们通常在向量的稀疏性很重要时使用L1范数。
公式:||v||1= |b1|+ |b2|+|b3|
L2范数
L2范数的符号是||v||2这种范数也称为欧几里得范数,L2范数计算为向量平方值之和的平方根,由于是可微函数,L2范数最常用于机器学习中的优化。
公式:||v||2= sqrt [ (b1)2+ (b2)2+ (b3)2]
向量最大范数
最大范数的符号是||v||inf,也可以用无穷大符号表示L∞,最大范数被计算为返回向量的最大值。
公式:||v||inf= max( |b1| , |b2| , |b3| )
许多应用程序,如信息检索、个性化、文档分类、图像处理等,都依赖于项目之间相似性或不相似性的计算。如果两个项目之间的距离较小,则认为两个项目相似,反之亦然。