一.什么是超平面?

百度百科中的定义:

超平面是n维欧氏空间中余维度等于一的线性子空间,也就是必须是(n-1)维度。

这是平面中的直线、空间中的平面之推广(n大于3才被称为“超”平面),是纯粹的数学概念,不是现实的物理概念。因为是子空间,所以超平面一定经过原点

西瓜书中的定义:

在样本空间中,划分超平面可通过如下线性方程来描述:                                  

超平面 目标检测 划分超平面_样本空间

其中,

超平面 目标检测 划分超平面_仿射变换_02

 和 

超平面 目标检测 划分超平面_样本空间_03

 都是 

超平面 目标检测 划分超平面_样本空间_04

 维列向量,

超平面 目标检测 划分超平面_样本空间_03

 为平面上的点,

超平面 目标检测 划分超平面_仿射变换_02

 为平面上的法向量,决定了超平面的方向,

超平面 目标检测 划分超平面_仿射变换_07

 是一个实数,代表超平面到原点的距离。显然,划分超平面可被法向量 

超平面 目标检测 划分超平面_仿射变换_02

 和 

超平面 目标检测 划分超平面_仿射变换_07

 确定。乍一看上述两个定义有矛盾,百度百科中说超平面一定过空间中的原点;但西瓜书中说 

超平面 目标检测 划分超平面_仿射变换_07

 是一个实数,代表超平面到原点的距离,因此不一定过原点。其实二者所讨论的超平面不是一种类型的超平面,百度百科定义的超平面是严格的线性子空间,即满足加法和乘法封闭性;而西瓜书中定义的超平面更像是一种仿射超平面,即任意线性子空间在任意仿射变换下的象。


 

好了,超平面的定义我们解释完了,让我们再回到定义超平面的线性方程中来:

对于一个三维空间中的任一平面,我们有平面的点法式方程和一般方程:

                        A(x-x0) + B(y-y0) + C(z-z0) = 0       和       Ax + By + Cz + D = 0   

1.平面点法式方程的推导

定义:如果一个非零向量垂直于一个平面,这向量就叫做该向量的法线向量。
法线向量的特征:垂直于平面内的任一向量。

超平面 目标检测 划分超平面_样本空间_11

 

超平面 目标检测 划分超平面_超平面 目标检测_12

 

2.平面一般方程的推导

超平面 目标检测 划分超平面_百度_13

 

 

 由此解释了为何 

超平面 目标检测 划分超平面_仿射变换_02

 为法向量和 

超平面 目标检测 划分超平面_仿射变换_07

 的含义。



 

二.点到超平面的距离

样本空间中的任意一点 

超平面 目标检测 划分超平面_超平面 目标检测_16

,到超平面 

超平面 目标检测 划分超平面_仿射变换_17

 的距离,可以表示为

 

 

                                        

超平面 目标检测 划分超平面_超平面 目标检测_18

点到超平面上的点为什么这么计算呢?我在这里再具体说一下。推导过程并不繁琐(这里以三维空间为例), 点到平面的距离公式(可以作为类比):

                                                              

超平面 目标检测 划分超平面_样本空间_19

                                                                           

超平面 目标检测 划分超平面_百度_20

注意:上面利用了向量内积的等价替换,例如下面2个向量做内积。

                                  

超平面 目标检测 划分超平面_百度_21

 

 

 



 

三.判断超平面的正反

一个超平面可以将它所在的空间分为两半, 它的法向量指向的那一半对应的一面是它的正面, 另一面则是它的反面。如果利用数学来判断的话,需要利用到法向量 

超平面 目标检测 划分超平面_百度_22


超平面 目标检测 划分超平面_超平面 目标检测_23

若将距离公式中分子的绝对值去掉, 让它可以为正为负. 那么, 它的值正得越大, 代表点在平面的正向且与平面的距离越远. 反之, 它的值负得越大, 代表点在平面的反向且与平面的距离越远。