有些东西,还是说清楚的好,比如超平面(hyperplane)这个东西。


  • 直线、平面

在说超平面之前,先说说 Rn 空间中的直线和平面。给定 Rn 空间中的一点 p 和一非负向量 v⃗



i=tv⃗+p


的点

i 的集合称为 Rn 空间中的一条直线。上式中 t 是一个标量,向量 v⃗ 决定了该直线的方向。如图1所示:


图1:line figure illustration


相对的,给定 Rn 空间中的一点 p 和两个线性无关的向量 v⃗,w⃗



i=tv⃗+sw⃗+p


的点

i 的集合称为 Rn 空间中的一个平面。上式中 t,s 均是标量。如图2所示:


图2:plane figure illustration


更一般的,给定 Rn 空间中的一点 p 和线性无关的向量 v1→,v2→,...,vk→



i=t1v1→+t2v2→+...+tkvk→+p


的点

i 的集合称为 Rn 空间的一个k维仿射子空间(k-dimensional affine subspace)。因此,一条直线就是一个1维仿射子空间,一个平面就是一个2维仿射子空间。

  • 直线的另一种表示

假设 R2 空间中的点集 i=(x,y)



ax+by+d=0(1)


其中

a,b,d 均为标量,并且 a,b 至少有一个不为0。假设 b 不为0,则



y=−abx−db



x=t,−∞<t<∞ ,则点集i可以表示为



i=(x,y)=(t,−abt−db)=t(1,−ab)+(0,−db)


这其实是一条经过点

(0,−db) 方向为 (1,−ab) 的直线L。

进一步地,我们设 n⃗=(a,b)



n⃗∗i+d=0(2)


设取

p=(p1,p2) 为L上一点,代入上式可以得到 d=−n⃗∗p ,则(2)式可以表示为



n⃗∗(i−p)=0(3)



可以看出,n⃗,并且点集

i=(x,y) 是那些与 p 的差向量与 n⃗ 正交的点。

  • 超平面

说了这么多,现在来给出超平面的定义:给定 Rn 空间中的一点 p 和一个非零向量 n⃗



n⃗∗(i−p)=0(4)


的点集

i 称为经过点 p 的超平面。向量 n⃗ 为该超平面的法向量。

按照这个定义,一条直线是 R2 空间的超平面,一个平面是 R3 空间的超平面,Rn 空间的超平面是 Rn

n⃗=(a1,a2,...,an),i=(i1,i2,...,in) ,则(4)式可以表示为



a1i1+a2i2+...+anin+d=0(5)


其中,

d=−n⃗∗p

很重要的一点是,利用一个超平面,我们可以将空间的点分为两部分(式(4)的值大于等于0或者小于0)。同时,利用式(4)我们可以方面的计算空间内一点到超平面的距离:设空间中一点 q ,q 到超平面的距离即是 q−p 在向量 n⃗



|(q−p)∗u⃗|=|q∗n⃗−p∗n⃗||n|||=|q∗n⃗+d|||n||


我们即可以求得

q 到超平面的距离。


图3:q到超平面H的距离