改进卷积输入的端到端普通话语音识别 End-to-End Mandarin Speech Recognition with Improved Convolution Input期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

改进卷积输入的端到端普通话语音识别

引用本文：	王彦哲,张立民,张兵强,李振宇.改进卷积输入的端到端普通话语音识别[J].计算机工程与应用,2019,55(17):143-149.

作者姓名：	王彦哲张立民张兵强李振宇

作者单位：	海军航空大学信息融合研究所,山东烟台,264000;海军航空大学信息融合研究所,山东烟台,264000;海军航空大学信息融合研究所,山东烟台,264000;海军航空大学信息融合研究所,山东烟台,264000

基金项目：	国家自然科学基金重大研究计划资助项目;泰山学者工程专项经费资助

摘要：	主流神经网络训练的交叉熵准则是对声学数据的每个帧进行分类优化,而连续语音识别是以序列级转录准确性为性能度量。针对这个不同,构建基于序列级转录的端到端语音识别系统。针对低资源语料条件下系统性能不佳的问题,其中模型使用卷积神经网络对输入特征进行处理,选取最佳的网络结构,在时域和频域进行二维卷积,从而改善输入空间中因不同环境和说话人产生的小扰动影响。同时神经网络使用批量归一化技术来减少泛化误差,加速训练。基于大型的语言模型,优化解码过程中的超参数,提高模型建模效果。实验结果表明系统性能提升约24%,优于主流语音识别系统。
关键词：	序列级低资源端到端卷积神经网络批量归一化
End-to-End Mandarin Speech Recognition with Improved Convolution Input

WANG Yanzhe,ZHANG Limin,ZHANG Bingqiang,LI Zhenyu.End-to-End Mandarin Speech Recognition with Improved Convolution Input[J].Computer Engineering and Applications,2019,55(17):143-149.

Authors:	WANG Yanzhe ZHANG Limin ZHANG Bingqiang LI Zhenyu

Affiliation:	Institute of Information Fusion, Naval Aviation University, Yantai, Shandong 264000，China

Abstract:

Keywords:	sequence level low resource end-to-end convolution neural network batch normalization
本文献已被维普万方数据等数据库收录！
	点击此处可从《计算机工程与应用》浏览原始摘要信息
	点击此处可从《计算机工程与应用》下载全文

设为首页 | 免责声明 | 关于勤云 | 加入收藏