基于CTC准则的普通话识别及改进 Mandarin Recognition and Improvement Based on CTC Criterion期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于CTC准则的普通话识别及改进

引用本文：	张立民,王彦哲,张兵强,朱念斌. 基于CTC准则的普通话识别及改进[J]. 计算机工程, 2019, 45(6): 249-253,266

作者姓名：	张立民王彦哲张兵强朱念斌

作者单位：	海军航空大学信息融合研究所,山东烟台,264000;中国人民解放军61923部队,北京,100000

基金项目：	国家自然科学基金;泰山学者工程专项

摘要：	主流神经网络训练的交叉熵准则针对声学数据的每个帧进行分类优化,而连续语音识别需以序列级的转录准确性为性能度量指标。针对这一差异,构建一种基于序列级转录的端到端语音识别系统。以音素为基本单元建模,并采用连接时序分类(CTC)的目标函数改进长短时记忆网络的结构。在解码过程中引入词典和语言模型,并在前端增加音调特征以丰富声学特征。利用序列区分度训练技术提升CTC模型的建模效果。实验结果表明,该系统的识别效率和识别准确率得到提高,词错误率最低可降至19.09%±0.16%。
关键词：	序列级端到端解码声学特征区分度训练
Mandarin Recognition and Improvement Based on CTC Criterion

ZHANG Limin,WANG Yanzhe,ZHANG Bingqiang,ZHU Nianbin. Mandarin Recognition and Improvement Based on CTC Criterion[J]. Computer Engineering, 2019, 45(6): 249-253,266

Authors:	ZHANG Limin WANG Yanzhe ZHANG Bingqiang ZHU Nianbin

Affiliation:	(Institute of Information Fusion,Naval Aeronautical University,Yantai,Shandong 264000,China;Troops 61923 of PLA,Beijing 100000,China)

Abstract:	ZHANG Limin;WANG Yanzhe;ZHANG Bingqiang;ZHU Nianbin(Institute of Information Fusion,Naval Aeronautical University,Yantai,Shandong 264000,China;Troops 61923 of PLA,Beijing 100000,China)

Keywords:	sequence level end-to-end decode acoustic feature discrimination training
本文献已被维普万方数据等数据库收录！

设为首页 | 免责声明 | 关于勤云 | 加入收藏