目录

  • 什么是范数?
  • 范数的类型
  • 常用的向量范数
  • 常用的矩阵范数
  • 向量求范数的具体操作
  • 矩阵求范数的具体操作
  • 范数的一种具体应用


什么是范数?

范数(norm)是数学中的一种基本概念。在泛函分析中,它定义在赋范线性空间中,并满足一定的条件,即①非负性;②齐次性;③三角不等式。它常常被用来度量某个向量空间(或矩阵)中的每个向量的长度或大小。

范数的类型

常用的向量范数

0范数(L0范数)-向量中非0元素的个数。

1范数(L1范数)-向量中各个元素绝对值之和。

2范数(L2范数)-向量的模长。

无穷范数(最大范数)-向量中各个元素绝对值的最大值。

常用的矩阵范数

F范数-矩阵中所有元素平方和然后开根号。

1范数(列范数)-求每列元素的绝对值之和的最大值

2范数(谱范数)-矩阵A的2范数指的是A矩阵的最大奇异值。也等于AAT(AT代表A的转置)最大特征值的平方根。

无穷范数(行范数)-求每行元素的绝对值之和的最大值

向量求范数的具体操作

这里以Cn空间为例,Rn空间类似。

最常用的范数就是p-范数。若

F范数使用pytorch实现 f范数定义_特征值

那么

F范数使用pytorch实现 f范数定义_F范数使用pytorch实现_02

可以验证p-范数确实满足范数的定义。其中三角不等式的证明不是平凡的,这个结论通常称为闵可夫斯基(Minkowski)不等式。

当p取1、2与无穷的时候分别是以下几种最简单的情形:
1-范数:║x║1=│x1│+│x2│+…+│xn│
2-范数:║x║2=(│x1│2+│x2│2+…+│xn│2)1/2
∞-范数:║x║∞=max(│x1│,│x2│,…,│xn│)
其中2-范数就是通常意义下的距离。

对于这些范数有以下不等式:

║x║∞ ≤ ║x║2 ≤ ║x║1 ≤ n1/2║x║2 ≤ n║x║∞

另外,若p和q是赫德尔(Hölder)共轭指标,即1/p+1/q=1,那么有赫德尔不等式:

|<x,y>| = ||xH*y| ≤ ║x║p║y║q

当p=q=2时就是柯西-许瓦兹(Cauchy-Schwarz)不等式。

矩阵求范数的具体操作

常用的三种p-范数推导出的矩阵范数:
1-范数:
║A║1 = max{ ∑|ai1|,∑|ai2|,……,∑|ain| } (列和范数,A每一列元素绝对值之和的最大值)(其中∑|ai1|第一列元素绝对值的和∑|ai1|=|a11|+|a21|+…+|an1|,其余类似);

2-范数:
║A║2 = A的最大奇异值 = (max{ λi(AHA) }) 1/2 (谱范数,即A^HA特征值λi中最大者λ1的平方根,其中AH为A的转置共轭矩阵);

∞-范数:
║A║∞ = max{ ∑|a1j|,∑|a2j|,…,∑|amj| } (行和范数,A每一行元素绝对值之和的最大值)(其中∑|a1j| 为第一行元素绝对值的和,其余类似);
其它的p-范数则没有很简单的表达式。

对于p-范数而言,可以证明║A║p=║AH║q,其中p和q是共轭指标。
简单的情形可以直接验证:║A║1=║AH║∞,║A║2=║AH║2,一般情形则需要利用║A║p=max{yHAx:║x║p=║y║q=1}。

范数的一种具体应用

矩阵的Frobenius范数可以用来比较目标矩阵与估计的矩阵值之间的误差。例如A、B、X三个矩阵,B=A*X,B矩阵由A矩阵变化而来,通过计算A、B矩阵之间的距离就能得出两者之间的相似程度。

F范数使用pytorch实现 f范数定义_向量空间_03


此时通过公式|| A - B ||F便可以的除两者的相似性(误差)。