首页 | 本学科首页   官方微博 | 高级检索  
     

基于CTC准则的普通话识别及改进
引用本文:张立民,王彦哲,张兵强,朱念斌. 基于CTC准则的普通话识别及改进[J]. 计算机工程, 2019, 45(6): 249-253,266
作者姓名:张立民  王彦哲  张兵强  朱念斌
作者单位:海军航空大学信息融合研究所,山东烟台,264000;中国人民解放军61923部队,北京,100000
基金项目:国家自然科学基金;泰山学者工程专项
摘    要:主流神经网络训练的交叉熵准则针对声学数据的每个帧进行分类优化,而连续语音识别需以序列级的转录准确性为性能度量指标。针对这一差异,构建一种基于序列级转录的端到端语音识别系统。以音素为基本单元建模,并采用连接时序分类(CTC)的目标函数改进长短时记忆网络的结构。在解码过程中引入词典和语言模型,并在前端增加音调特征以丰富声学特征。利用序列区分度训练技术提升CTC模型的建模效果。实验结果表明,该系统的识别效率和识别准确率得到提高,词错误率最低可降至19.09%±0.16%。

关 键 词:序列级  端到端  解码  声学特征  区分度训练

Mandarin Recognition and Improvement Based on CTC Criterion
ZHANG Limin,WANG Yanzhe,ZHANG Bingqiang,ZHU Nianbin. Mandarin Recognition and Improvement Based on CTC Criterion[J]. Computer Engineering, 2019, 45(6): 249-253,266
Authors:ZHANG Limin  WANG Yanzhe  ZHANG Bingqiang  ZHU Nianbin
Affiliation:(Institute of Information Fusion,Naval Aeronautical University,Yantai,Shandong 264000,China;Troops 61923 of PLA,Beijing 100000,China)
Abstract:ZHANG Limin;WANG Yanzhe;ZHANG Bingqiang;ZHU Nianbin(Institute of Information Fusion,Naval Aeronautical University,Yantai,Shandong 264000,China;Troops 61923 of PLA,Beijing 100000,China)
Keywords:sequence level  end-to-end  decode  acoustic feature  discrimination training
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号