1. 语音识别技术的重要性

各种终端设备的智能化和集成化程度越来越高,传统的信息检索和菜单操作方式已经越来越无法满足需求。迫切需要一种更加便捷的信息检索和命令方式来替代传统的按键操作。

语音识别技术的基本内容包括以下内容:

  • 语音识别基本单元
  • 语音识别流程
  • 语音识别技术应用

2 语音识别基本单元

语音识别系统组成

语音识别系统本质上是一种模式识别系统,包括特征提取、模式匹配、参考模式库等三个基本单元。

语音识别常用的模型架构hmmdnnrnn 语音识别的技术框架_语音识别

语音识别研究领域分类

在语音识别系统中,可以根据不同的方式对语音识别的研究进行分类。

语音识别常用的模型架构hmmdnnrnn 语音识别的技术框架_特征提取_02

3 语音识别流程

基于HMM的语音识别过程

  • 在开始语音识别之前,通常需要把首尾段的静音切除,降低对后续步骤的干扰。这个静音切除的操作一般称为VAD。
  • 语音识别常用的模型架构hmmdnnrnn 语音识别的技术框架_信息检索_03

  • 分帧,也就是把声音切开成多个小段,每小段称为一帧。
  • 语音识别常用的模型架构hmmdnnrnn 语音识别的技术框架_语音识别_04

  • 波形变换:常用的一种方法是MFCC特征,通过12维度的向量来描述一帧的波形,12维向量是根据耳朵的生理特征提取的,这一过程称为声学特征提取。
  • 语音识别常用的模型架构hmmdnnrnn 语音识别的技术框架_语音识别_05

  • 矩阵变成文本
  1. 把帧识别成状态;
  2. 把状态组合成音素;
  3. 把音素组合成单词。
  • 语音识别过程总结

4 语音识别最新进展

最新进展

  • 目前,国外的应用一直以苹果的Siri,谷歌的Google Now为代表。
  • 国内国内方面,科大讯飞、云知声,百度语音等系统都采用了最新的语音识别技术,市面上其他的相关产品也直接或间接潜入了类似的技术。