从今天开始我们将开启一个新的深度学习章节, 为大家来讲述一下深度学习在语音识别 (Speech Recognition) 的应用. 语音识别技术可以将语音转换为计算机可读的输入, 让计算机明白我们要表达什么, 实现真正的人机交互. 希望通过本专栏的学习, 大家能够对语音识别这一领域有一个基本的了解.
语音识别的历史语音识别, 又称作自动语音识别 (Automatic Speech Recognition), 其历史可以追溯到上世纪 50 年代. 1952 年贝尔研究所 Davis 等人研究成功了世界上第一个能识别 10 个英文数字发音的实验系统. 2000 年后, 随着深度学习技术, 特别是 DNN 的发展, 语音识别的准确率得到了显著的提升, 并得到大幅发展.
语音识别的应用语音识别在多个领域都有运用:
- 科技: 日常生活中我们随处可见天猫精灵, 小度, Alexa 等产品. 在生活中给我们提供便利, 实现万物互联
- 翻译: 语音识别可以帮助我们跨越语言的鸿沟, 实现不同语言间的翻译
- 销售: 语音机器人可以帮助我们确定客服的基本需求, 提高销售效率