基于深度LSTM的端到端的语音识别 End-to-End Speech Recognition Based on Depth-Gated LSTM期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于深度LSTM的端到端的语音识别

引用本文：	张瑞珍,韩跃平,张晓通. 基于深度LSTM的端到端的语音识别[J]. 中北大学学报(自然科学版), 2020, 41(3): 244-248. DOI: 10.3969/j.issn.1673-3193.2020.03.010

作者姓名：	张瑞珍韩跃平张晓通

作者单位：	中北大学信息与通信工程学院,山西太原 030051,中北大学信息与通信工程学院,山西太原 030051,中北大学信息与通信工程学院,山西太原 030051

摘要：	基于长短时记忆(LSTM)神经网络在语音识别方面的良好性能,本文引入了一种新的深度LSTM方法.该方法利用深度控制门控函数连接多层LSTM单元,在循环神经网络中引入了上下层之间的线性相关性,可以更深层地构建语音模型.同时利用链接时序分类的训练准则进行模型训练,搭建端到端语音识别系统,解决了隐马尔可夫模型需要将标签和序列强制对齐的问题.实验表明,深度LSTM可以提高语音建模的性能,相比使用标准LSTM的模型,在准确率方面提高约4%.
关键词：	语音识别深度LSTM 链接时序分类端到端
End-to-End Speech Recognition Based on Depth-Gated LSTM

ZHANG Rui-zhen,HAN Yue-ping,ZHANG Xiao-tong. End-to-End Speech Recognition Based on Depth-Gated LSTM[J]. Journal of North University of China, 2020, 41(3): 244-248. DOI: 10.3969/j.issn.1673-3193.2020.03.010

Authors:	ZHANG Rui-zhen HAN Yue-ping ZHANG Xiao-tong

Abstract:

Keywords:
本文献已被 CNKI 万方数据等数据库收录！

设为首页 | 免责声明 | 关于勤云 | 加入收藏