讯飞语音识别python 讯飞语音识别准确率_语音识别

图为6月12日,讯飞输入法联合创始人翟吉博在“爱输入·更懂你”的媒体见面会上展示黑科技。

消息 一分钟打出400字,是什么样的体验?以往只有专业速录员能实现的打字速度,如今运用了大量AI黑科技的智能语音输入也可以让你体验这样的速度!在速录的同时它还能让用户以语音进行修改、添增、删除文字的操作。

6月12日,在讯飞输入法于北京举办的“爱输入·更懂你”的媒体见面会上,讯飞输入法市场品牌负责人李强军介绍说,讯飞输入法在输入效率和智能化方面取得了长足的进步,不仅做到一分钟识别400字,还支持多语种实时语音翻译、超长语音输入、耳语输入、离线语音输入等功能。

截至目前,讯飞输入法用户规模突破6亿,语音输入月覆盖率达50%,语音渗透率保持逐年上升态势。

讯飞输入法联合创始人翟吉博表示,当前讯飞输入法的通用语音识别率为98%,同时,对于含糊不清的口音、噪声环境、多人对话场所等会给语音识别造成影响的场景,也已经有了解决方案。基于科大讯飞精简和优化的Hybrid-DFCNN全新语音识别框架,6月底讯飞输入法将上线Hyper-CNN语音新引擎。此外,还将有效优化中英混合语音输入、粤语等重点方言、标点判断准确率、“他”和“她”的区分识别等功能,提升语音输入的体验。

即便说不好普通话,也难不倒讯飞输入法。翟吉博介绍,目前讯飞输入法支持22种方言,其中粤语、四川话、东北话等识别率均已超过90%。“依托对AI技术及语言深度研究的积累,采用Multi-lingual多语言建模,通过多方言数据共享方式训练;辅以GlobalPhone全球音素集,从声学层面的相似性统一各方言的音素定义,对方言‘语图谱’模型做进一步精进,从而有针对性地提升方言语种的识别能力。”据了解,6月底,讯飞输入法还将新增苏州话识别,方言识别语种扩至23种。

2017年,讯飞输入法对外发起“方言保护计划”,建立“中国方言库”,用智能语音留存、发展承载传统文化积淀的方言,积累了海量方言数据,方言识别率日趋精准。为保护濒危语言、优化方言语音识别能力,6月12日当天科大讯飞还启动了“AI方言发音人招募”公益行动。

除了方言识别,机器翻译等新技术也将逐步融合在输入法中,面对面的交互方式、中文与英日韩俄多语种即时翻译都将引入语音翻译应用中。例如,在对话双方各讲母语时,另一方就会同步看到翻译结果,特别是还加入了语音播报功能,让面对面翻译有了自己的“嘴巴”,身边俨然有了一位“翻译官”,将翻译功能场景化。