最近完成学校里的滚动轴承故障诊断时,发现近几年对大多数非平稳信号的预处理都会采用EMD ( Empirical Mode Decomposition)。EMD实际是由黄锷提出HHT( Hilbert - Huang Transform)中对于非稳态信号作希尔伯特谱分析的一个基础。在各大论坛当中已经有相当多的博主对EMD例程进行了解释,在此以浅显理解原理及使用为目的

此处先给出EMD的一个基础和定义

1)EMD方法基础:

 

非平稳信号是若干个本征模态函数(Intrinsic Mode Function)的和

2)IMF的定义:

1)在该信号的整个时间范围内,其局部的极值点和过零点的个数要相同或者最多相差1;

2)对该信号的任意时刻,其局部极大值连成的上包络线和局部极小值连成的下包络线的均值为零;

 

EMD分解的意义

 

1.平稳信号和非平稳信号(Stationary Signal and Non-stationary Signal)

 

平稳信号和非平稳信号性质的衡量指标是信号的概率统计与分布,如期望。如果信号的概率统计与分布特性不随时间而变化,则称该信号为平稳信号。反之,则为非平稳信号。用一个更加浅显的说法来讲,信号的概率统计与分布特性倘若不发生改变,信号的某段内容会沿着时间延展而反复出现,也就是信号频率所描述的一个性质。那么就可以粗略的将平稳信号看作为信号当中的频率成分不随时时间而发生变化的信号

 

2.复信号和解析信号(Complex Signal and Analytic Signal )

 

首先要对复信号的概念有一个理解:

任何在频域分析中只具有正频率特征的信号都是复信号。

 

然后再对解析信号作一个浅显的解释:

对于分析所获得的复信号,规定其实虚部正交,并且相位相差PI/2的复信号为解析信号。

 

傅里叶变换从实质上来看其实是欧拉公式的转换,而傅里叶变换又是信号频率分析的基础。换句话讲,信号频率分析的基础是欧拉公式。

 

平时我们接受的周期信号是sin 和 cos 之和的是信号,对欧拉公式作变换,分别用欧拉公式表示sin和cos。那么可以看到sin和cos作简傅里叶变换后其信号当中含有共轭对称的频率分量。但是在对信号分析的时候,由于负频率不存在物理意义,我们往往会去除负频率部分。那么现在再关注欧拉公式的原型,公式的一侧只有正频率时,所分析的信号实际是一个复信号,且其实部与虚部正交,实部比虚部相位滞后PI/2。

 

刚刚所谈及的是平稳信号,对于频率非平稳信号,分析时因为只取其正频率成分同样也会使分析信号由实信号转变为复信号。一般的,在对实信号作分析时,由于采用了欧拉公式进行变换,其变换之后的信号往往具备欧拉公式的性质,并且具备该类性质的信号在分析时有一定的优势,因此规定实虚部正交且相位滞后为PI/2的信号(实虚部为一对希尔伯特变换对)为解析信号。解析信号中“解析”的含义就是如此而来的。

详细公式如图:

EMD获得的IMF成分怎么重构信号 imf=emd(x)_EMD经验模式分解

3.解析信号的瞬时频率

 

对处于复数域的解析信号,引入瞬时频率的概念:瞬时相位对于时间的一阶导数为该解析信号的瞬时频率

 

瞬时频率频率在某一时刻的变化率,但是变化率不是频率,没有实际的意义,只有在一段时间内估计信号的频率才有意义。

 

HHT的目的主要是为解决对非平稳信号频率成分和能量的分析。但是瞬时频率并不具有实际的意义。因此定义一种信号使其的瞬时频率具有实际意义,并且认定任何信号都可以由这样的信号叠加而成。如果能将信号中这用类型的信号分离出来,就可以进而分析信号的频率和能量组成,也就所谓的EMD分解。

 

IMF定义的意义

 

上文说到,EMD分解是为了将一个非稳态信号分解成为多个瞬时频率具有实际意义的信号,这样的信号也就是IMF。那么IMF的两条定义就是达到这样的作用,根据上面已经提过的部分铺垫,现在来解释两个条件。

 

条件1:在该信号的整个时间范围内,其局部的极值点和过零点的个数要相同或者最多相差1; 

 

我们在计算一个周期信号的周期或频率时,最常采用的方式是求临近的两个最大值之间的距离,或是计算过零点的距离,这是因为过零点和极值点具有衡量频率的意义。平稳信号的极值点和过零点在整个时间段内是稳定不改变且相差个数有限的,这是一个信号平稳的必要条件。此处IMF的定义中明确,局部的极值点和过零点个数相差有限。这说明该信号在整个时间范围内,局部满足这样一个必要条件。这个定义不是通过数学表达式严格给出的,所以它所规定的IMF函数可以是平稳信号、也可以是非平稳信号。但是无论信号的种类如何,由于它局部具有了平稳信号的必要条件,限制了该变动的范围,使IMF成为一个频率变动集中在某一较小范围内的子信号。

 

条件2:对该信号的任意时刻,其局部极大值连成的上包络线和局部极小值连成的下包络线的均值为零;

 

在已经限制了频率变动范围后,为了使信号的瞬时频率具有意义,就是要使瞬时频率等于该时刻前后一段时间内的平均频率。平稳信号由于频率组成不变、统计分布特性不变,其特定情况下的均值可以为零,是平稳信号的一个必要条件。不过此处IMF的定义使用的是局部上下包络线的均值为零,是信号均值为零的一种条件扩大。该处规定局部,则使IMF信号在任意一个时刻的局部时段内具有平稳信号频率稳定的必要条件,使瞬时频率在局部时段内基本不变,具有实际意义。

 

EMD算法的理解

 

对于EMD的详细分解方法,各大论坛和书籍当中已经有了颇为详细的介绍,此处不再累述,仅放上对各步骤的总结和理解。

 

EMD算法实际上是一个循环过程 

 

1.对带分解信号A_(n-1)(t)取上下包络 ->2.去除上下包络均值IMF_(n-1)=A_(n-1)(t) - E_(n-1)(t) ->3.得到新待分解信号(A_n(t)=IMF_(n-1)) ->1.->2.->...again

 

取的上下包络是信号中频率较低的成分(甚至可以理解为趋势项),因此去除包络后得到的IMF是一个具有较高频率成分,但是变化范围被限制住的一个信号。从原信号中去除IMF后,再次进入循环,直到满足停止分解条件为止。先取出的IMF比后取出的IMF的波动要来的频率高。(如:IMF_1比IMF_2波动快,频率高)。一般的,当新的待分解信号为单调函数后停止。单调函数是一个没有重复变化的信号,则可以将该条件理解为,当待分解信号为频率为零时停止分解。

 

参考条目

1.百度百科-经验模式分解

2.百度百科-平稳信号

3.知乎-希尔伯特变换和瞬时频率问题--连载(二)

4.知乎-希尔伯特变换将信号表示为复解析信号的物理意义是什么?

5.新浪博客-信号处理中为什么用复信号

 

6. 原文The Royal Society-The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysis 7. 知网-杨宇,于德介,程军圣.基于EMD与神经网络的滚动轴承故障诊断方法[J].振动与冲击,2005(01):87-90+138-139.