hesan矩阵正定 hessian矩阵的正定负定

转载

mob64ca13fb6939 2024-04-17 19:52:31

文章标签 hesan矩阵正定线性代数特征值对称矩阵 文章分类 架构后端开发

特征值_{2021年4月22日10点39分}

Hessian矩阵用于判别平行于floor的切平面是鞍面、极小值还是极大值面，当特征值eigenvalue都大于0时，g(x)=0的切平面x是极小值面，而多元函数的Hessian矩阵是实对称矩阵，symmetric matrix，Hessian矩阵如果是正定的，definite,那么x就是极小值面，如果是半正定，semi definite，也就是特征值可能有0，那么还需要求助于三阶导数。

上面这段话涉及特征值，正定的含义。特征值我记得不太好算，而正定的定义相对简单，https://zhuanlan.zhihu.com/p/44860862这篇文章介绍得比较清楚，对于任意非0列向量 $hesan矩阵正定 hessian矩阵的正定负定_特征值$ ，只要 $hesan矩阵正定 hessian矩阵的正定负定_特征值_02$ ，那么 $hesan矩阵正定 hessian矩阵的正定负定_hesan矩阵正定_03$ 就是正定的，含义和函数 $hesan矩阵正定 hessian矩阵的正定负定_特征值_04$ 一致，只要 $hesan矩阵正定 hessian矩阵的正定负定_特征值_05$ ，那么函数 $hesan矩阵正定 hessian矩阵的正定负定_对称矩阵_06$ ，这篇文章还证明了协方差矩阵是半正定的，结合这篇文章的证明，发现可以将 $hesan矩阵正定 hessian矩阵的正定负定_特征值_07$ 视作 $hesan矩阵正定 hessian矩阵的正定负定_对称矩阵_08$ ，只不过这里的 $hesan矩阵正定 hessian矩阵的正定负定_对称矩阵_09$ 是随机变量， $hesan矩阵正定 hessian矩阵的正定负定_特征值_10$ 。
为了查询特征值的含义，翻了翻Algebra done right。
2.1 居然从复数空间、集合和列表啥的讲起。
linear algebra done right里提到的一个span概念以前从来没见过，粗略看去就是对一个向量列表(list而不是set)里的向量进行的线性组合，span的意思是跨距，查了下，翻译是“张成”。这个span引出了好几个定义。向量空间V里的向量组成的列表(v1,v2,v3…,vm)，这个列表里的向量的span，span(v1,v2,…,vm)，是V的最小子空间，或者说这些向量张成了空间V。这本书开始还从符号表示如小、花括号，箭头，的角度入手引出了向量空间这个概念。span还可以引出多项式空间Pm(F),这个概念当时学有限域时觉得很模糊，这里讲得也不太清楚，把函数自变量z换成域F，函数p换成大写P，P(F)就是集合，函数的集合，但和F以及F^F的关系，就不太清楚了。线性独立性中文表述为“表达式”是唯一的，
这里wheter the choice of scalars is unique…线性依赖性的相关性质用span来证明比较方便。
线性独立的向量个数小于张成空间的向量的个数，证明过程是不断插入移除向量来完成的，但还是有点儿模糊，从这点上看，不觉得这本书有那么好。
2.2 _{2021年4月26日} 这两天在看线性代数及其应用，这本书以前看过怎么正交化的部分，前面没怎么看过，这次借着查特征值的机会重新看了下，途中有矩阵分解的内容讲得不太清楚，今天翻了下数值分析的解方程组。定理和具体的迭代式没有用笔写，只是看看，总体来说，记住高斯消元法和对称矩阵的平方根法的 $hesan矩阵正定 hessian矩阵的正定负定_线性代数_11$ 就应该差不多了，高斯消元法记住 $hesan矩阵正定 hessian矩阵的正定负定_hesan矩阵正定_12$ 的复杂度（看下标从哪到哪），和平方根法的动态运算过程，但pdf上没有笔记，书放宿舍了，待会儿吃完饭温习下，再记录下矩阵分解几个要点，就算完事儿了，再查下matlab或者python不知道有没有相关的函数。另外，线性代数这儿回顾后，可以直接看下张贤达的矩阵分析，矩阵微分一直没怎么搞懂，后面也可以衔接上最优化。直觉上觉得对EM算法混淆损。
三角分解_{2021年4月27日10点53分}
$hesan矩阵正定 hessian矩阵的正定负定_hesan矩阵正定_13$ 为下三角单位矩阵， $hesan矩阵正定 hessian矩阵的正定负定_特征值_14$ 是上三角矩阵，维度和原矩阵都是 $hesan矩阵正定 hessian矩阵的正定负定_特征值_15$ ,用 $hesan矩阵正定 hessian矩阵的正定负定_对称矩阵_16$ 表示行标，用 $hesan矩阵正定 hessian矩阵的正定负定_线性代数_17$ 表示列标， $hesan矩阵正定 hessian矩阵的正定负定_hesan矩阵正定_13$ 的列标大于行标 $hesan矩阵正定 hessian矩阵的正定负定_hesan矩阵正定_19$ 时 $hesan矩阵正定 hessian矩阵的正定负定_线性代数_20$ ，当对列标进行叠加时 $hesan矩阵正定 hessian矩阵的正定负定_对称矩阵_21$ 时， $hesan矩阵正定 hessian矩阵的正定负定_特征值_22$ ，这里不要认为 $hesan矩阵正定 hessian矩阵的正定负定_对称矩阵_23$ ，因为这里的 $hesan矩阵正定 hessian矩阵的正定负定_特征值_24$ 指的是对角线元素所在列下面的元素， $hesan矩阵正定 hessian矩阵的正定负定_hesan矩阵正定_25$ ，之所以只关注对角线元素所在列下面的元素是因为前面一列已经求好了。而 $hesan矩阵正定 hessian矩阵的正定负定_特征值_14$ 对应的 $hesan矩阵正定 hessian矩阵的正定负定_hesan矩阵正定_27$ 当 $hesan矩阵正定 hessian矩阵的正定负定_线性代数_28$ 时 $hesan矩阵正定 hessian矩阵的正定负定_线性代数_29$ 。三角分解第一行不变，第一列除以第一列的主元即可，然后先求出包括对角线元素的行元素，行元素是用当前值减去所在行列的对应元素乘积和，如 $hesan矩阵正定 hessian矩阵的正定负定_特征值_30$ ， $hesan矩阵正定 hessian矩阵的正定负定_线性代数_31$ 和 $hesan矩阵正定 hessian矩阵的正定负定_对称矩阵_32$ 没有对应的行元素。再求对角线下的列元素，列元素的操作比行元素多了个除以已经求出来的对角线上的元素。如果是列主元选取，选出列最大值即可。动态过程就是这样从左上角往右下角划分行列《李庆扬》p153
平方根法_11点12分
Cholesky分解矩阵为两个互为转置的三角矩阵，ij位置本来是第一个矩阵的第i行乘以第二个矩阵的第j列，但第j列就是第一个矩阵的第j行，本来是 $hesan矩阵正定 hessian矩阵的正定负定_对称矩阵_33$ 变成了 $hesan矩阵正定 hessian矩阵的正定负定_hesan矩阵正定_34$ 当列遍历下标 $hesan矩阵正定 hessian矩阵的正定负定_线性代数_17$ 大于行标时 $hesan矩阵正定 hessian矩阵的正定负定_线性代数_36$ ，所以 $hesan矩阵正定 hessian矩阵的正定负定_对称矩阵_37$ ，对角线和下面的元素，都需要把 $hesan矩阵正定 hessian矩阵的正定负定_hesan矩阵正定_38$ 或者 $hesan矩阵正定 hessian矩阵的正定负定_对称矩阵_39$ 分离出来， $hesan矩阵正定 hessian矩阵的正定负定_线性代数_40$ ,
平方根法动态过程：先对第一列主元开平方，然后第一列下面的元素除以主元得到第一列，对角线上的元素等于对角线上的元素减去对应行的元素平方的差再开根号，列不需要了。对角线下面的元素减去对应行列或者对应的两个行的元素乘积再除以已经求出来的对角线上的主元。
除了第一列，对角线下的元素的求法和三角分解一样，都要除以已经求出来的主元。对角主元需要开平方，而三角分解不需要（三角分解下三角是单位下三角，而平方根法是转置的），而且平方根法不要求行只求列即可。
2.3 _{2021年5月1日20点28分}附上笔记
1 这个地方对向量的定义很顺滑

2 主元个数小于列向量个数

3 平面的表示隐式和显式

4 应该习惯向量方程，而不是矩阵方程

5 肉眼观察是否线性相关

6 方程解和线性相关等问题：有非平凡解则向量方程形式的权必不全为零

7 线性变换属于函数映射

8 矩阵的m行n列可以从函数的定义域值域来看待；列数等于行数可以从向量方程的权和项要对应的角度来看待

hesan矩阵正定 hessian矩阵的正定负定_线性代数_41

9 A只有前两行或者前两列有主元，m<n,映射后的值域是R^2;第三个维度是零向量

hesan矩阵正定 hessian矩阵的正定负定_对称矩阵_42

10 r^2 到R^3的变换，系数有2个，原象也就是解是2维的，矩阵列数也就是自变量个数，或者次数，是2.

hesan矩阵正定 hessian矩阵的正定负定_特征值_43

11 原象可以写成单位矩阵的的列向量和各维度的乘积72

hesan矩阵正定 hessian矩阵的正定负定_特征值_44

12 In和A m×n;变换T能作用域单位向量，原因是原象能写成单位向量与各维度的乘积和，再由于变换的线性，将原象各维度作为系数提取了出来。

hesan矩阵正定 hessian矩阵的正定负定_线性代数_45

13 这里的x可以有任意维度,假设为n，可以看出映射后m=n，In,对第一个维度，也就是第一个单位列向量，标准矩阵应该使得单位列向量第一个值变成三倍，结果也就是变换矩阵的第一列，第一个列向量。

hesan矩阵正定 hessian矩阵的正定负定_对称矩阵_46

14 满射，则方程组至少有一个解，方程组的个数可能小于变量个数，各列向量线性相关。

hesan矩阵正定 hessian矩阵的正定负定_hesan矩阵正定_47

15 哪怕理解了含义，还是会忘，

这里盲猜“射”是射箭，单射就是原象m维向量空间的点，射到值域n维向量空间，

单射：强调值域中的元素（不是所有的元素，有些元素跟原象空间没关系）是原象空间里一个个射过来的，不存在两个人同时射中一个值域点。线性变换或者解方程时体现的是解的唯一性。（跟原象空间没关系的是特解？）

满射：强调值域中任意一个元素都是原象里射过来的，可能是几个人同时射中了一个点，也可能只是一个人射中一个点，但都是原象空间里射过来的（“满”取“原象空间的映射变换充满了值域”之意？），线性变换或者解方程时体现的是解的存在性，有没有解。

hesan矩阵正定 hessian矩阵的正定负定_线性代数_48

16 只有一个解或者没有解，列向量线性无关，主元个数等于列向量个数，方程组个数等于系数变量个数…77

hesan矩阵正定 hessian矩阵的正定负定_hesan矩阵正定_49

17分块的意义是处理稀疏矩阵94

hesan矩阵正定 hessian矩阵的正定负定_hesan矩阵正定_50

18 可逆和解的唯一性等价的原因是两边能同时乘以矩阵的逆消掉变换矩阵104

hesan矩阵正定 hessian矩阵的正定负定_线性代数_51

19可逆性和等价于解的唯一性，解的唯一性相当于列向量的线性无关，线性无关的列向量的元素个数也就是矩阵行数，每一行都有主元，

总的来概括就是单位矩阵。

hesan矩阵正定 hessian矩阵的正定负定_对称矩阵_52

20 双射，可逆线性变换114

hesan矩阵正定 hessian矩阵的正定负定_hesan矩阵正定_53

21 D多项式集合以及函数都是向量空间

hesan矩阵正定 hessian矩阵的正定负定_对称矩阵_54

22 二维空间不是三维空间的子空间

hesan矩阵正定 hessian矩阵的正定负定_特征值_55

23 列空间就是等号右边的向量所属的空间，零空间就是解集所属的空间，像是从零空间通过变换A映射到列空间。

hesan矩阵正定 hessian矩阵的正定负定_特征值_56

24 微分方程也是线性变换，满足线性和可加性

hesan矩阵正定 hessian矩阵的正定负定_线性代数_57

25有些向量不能写成方程组的形式，也就不能用有无解来研究是否线性无关了

hesan矩阵正定 hessian矩阵的正定负定_对称矩阵_58

26 向量空间的基的定义也得从子空间来

hesan矩阵正定 hessian矩阵的正定负定_线性代数_59

27 函数向量空间超出平常的有大小有方向就是向量空间的日常概念

hesan矩阵正定 hessian矩阵的正定负定_线性代数_60

28 生成集中也含有冗余，只有线性无关才是基

hesan矩阵正定 hessian矩阵的正定负定_对称矩阵_61

29 这几页讨论怎么在一个矩阵中找出线性无关的列向量，生成等号右端的向量的空间

。

hesan矩阵正定 hessian矩阵的正定负定_对称矩阵_62

30 行变换只是为了探寻原来矩阵各列的关系，但变换后的各向量生成不了原向量空间

hesan矩阵正定 hessian矩阵的正定负定_hesan矩阵正定_63

31 向量的坐标原来是基向量的权值

hesan矩阵正定 hessian矩阵的正定负定_hesan矩阵正定_64

32同构是指经过线性变换的不同空间的向量

hesan矩阵正定 hessian矩阵的正定负定_特征值_65

33 主元列可以线性组合为非主元列向量，从而组成等号右端也就是列空间的有效成分只有主元列向量，非主元列向量的个数等于自由向量的个数，目前的观察来看

，

主元列向量的个数等于矩阵行数，零空间的维度等于自由变量的个数，是指自由变量个数个向量的线性组合决定了所有的零空间的向量，零空间的向量就是

解向量，解向量被自由向量集合线性组合而成；等号右边的列向量由矩阵中的线性无关列向量线性组合而成。

hesan矩阵正定 hessian矩阵的正定负定_特征值_66

34 这个矩阵只需要两个列向量就能生成，所以列空间的基是第1列和第3列向量，而解向量由3个自由向量乘以各自自由

解然后加起来构成，所以零空间解空间的维数是3.

hesan矩阵正定 hessian矩阵的正定负定_hesan矩阵正定_67

35 行化简在计算中不可行，计算秩和各个空间

hesan矩阵正定 hessian矩阵的正定负定_线性代数_68

36 b1=4c1+c2表示在C坐标系中B坐标系的基向量之一b1的坐标为(4,1)

hesan矩阵正定 hessian矩阵的正定负定_特征值_69

37 坐标向量就是相应的基向量的权值

hesan矩阵正定 hessian矩阵的正定负定_对称矩阵_70

38 基的变换矩阵的各列向量是线性无关。这是基向量的坐标向量的性质决定的。

hesan矩阵正定 hessian矩阵的正定负定_hesan矩阵正定_71

39 特征向量是非零向量，方程组的解有非平凡解！

hesan矩阵正定 hessian矩阵的正定负定_线性代数_72

40 有自由变量表示方程组有非平凡解，而特征向量的定义就是这样的方程组的非零解向量。

hesan矩阵正定 hessian矩阵的正定负定_hesan矩阵正定_73

41 这段话解释了为啥要变换矩阵为行阶梯形，行阶梯形的对角线上要有0，

才能让方程组有自由变量，有自由变量就有非平凡解，特征向量就是非平凡解，

但可虑的是对角线上的元素都等于0和矩阵A所有的特征值是完全对应的吗？

hesan矩阵正定 hessian矩阵的正定负定_对称矩阵_74

42 不可逆和0特征值在不同地方有不同应用，但可以转化…;特征向量是线性无关的…

hesan矩阵正定 hessian矩阵的正定负定_hesan矩阵正定_75

hesan矩阵正定 hessian矩阵的正定负定_特征值_76

43 求特征值和特征向量的，看方阵A能把特征向量伸缩多少倍…

hesan矩阵正定 hessian矩阵的正定负定_对称矩阵_77

44 列向量线性无关和行列式不等于0的联系是列向量构成的体积不等于0，线性

无关也就是可逆，而可逆以及特征值属于线性变换，映射，不太好和直观的

三维图形联系起来…·

hesan矩阵正定 hessian矩阵的正定负定_特征值_78

45 特征值相同，特征向量应该也相同，这有啥意义？能把这个向量线性变换到相同方向的相同位置两IC

？

hesan矩阵正定 hessian矩阵的正定负定_hesan矩阵正定_79

46 我觉得对特征值的记忆还是应该首先想到线性变换到相同的空间上去…;特相似矩阵具有相同的特征多项式…?j就是说有些变换对一些向量的作用是相似的…

hesan矩阵正定 hessian矩阵的正定负定_特征值_80

47 z张成和生成就是子空间与子空间基的区别

hesan矩阵正定 hessian矩阵的正定负定_hesan矩阵正定_81

48 正交和线性无关不要混淆了

hesan矩阵正定 hessian矩阵的正定负定_特征值_82

49 投影值，也就是权值,

hesan矩阵正定 hessian矩阵的正定负定_hesan矩阵正定_83

50 投影点还有距离原来向量最近的性质

hesan矩阵正定 hessian矩阵的正定负定_线性代数_84

51 投影向量的分解是子空间W的正交基与正交基的转置的乘积再与原向量的相乘线性变换。

所以正交基和正交基转置的内积的意义就在这儿，的确挺别扭的，只是形式上的而已…本来是正交基和原向量的内积，然后再和正交基内积，现在换了个顺序…

hesan矩阵正定 hessian矩阵的正定负定_特征值_85

52 维度是指向量个数，不是向量元素个数

hesan矩阵正定 hessian矩阵的正定负定_hesan矩阵正定_86

53 这个“减”从空间几何上和“去掉”，‘减去’的减法意义上都可以理解正交合成方面的正交化意义

hesan矩阵正定 hessian矩阵的正定负定_特征值_87

54 QR分解，Q是单位正交基，R是上三角可逆矩阵…;我觉得QR分解效果跟特征矩阵和特征值的分解效果差不多，不过QR分解要求矩阵A的列向量线性无关。

hesan矩阵正定 hessian矩阵的正定负定_对称矩阵_88

55 这属于找到非零的零空间问题;为了找出x，所以认为是零空间；但仔细想想，是矩阵A的列向量的线性合成来逼近b，所以处理对象应该是矩阵A各列构成的列空间和b这两个对象。;正交投影还要考虑原向量减去投影向量这个问题… ;正交于一个子空间，那么正交于张成这个子空间的列向量，也就是矩阵A的ge列。

hesan矩阵正定 hessian矩阵的正定负定_特征值_89

56 Ax^是由A确立的子空间中最接近b的向量，这个向量是b在空间A中的投影向量。

hesan矩阵正定 hessian矩阵的正定负定_对称矩阵_90

57 这个定理不太好直观理解记忆，注释一下：首先，Ax`是原向量在A列向量张成的子空间W中的投影向量，投影向量和原向量的关系可以用投影向量所在的子空间的正交基和其转置的乘积来线性映射得到，形式就是正交基与正交基的转置形成的矩阵与原向量相乘。从后往前看就明白为什么近似解x’要取R的逆和Q的转置乘积的形式了…;这里再特别注明：子空间的单位正交基和正交基的转置的乘积不等于单位矩阵，因为左矩阵是先用行去乘；但单位正交基的转置和单位正交基的乘积就是单位矩阵！！！

hesan矩阵正定 hessian矩阵的正定负定_特征值_91