首页 | 本学科首页   官方微博 | 高级检索  
     

基于深度LSTM的端到端的语音识别
引用本文:张瑞珍,韩跃平,张晓通. 基于深度LSTM的端到端的语音识别[J]. 中北大学学报(自然科学版), 2020, 41(3): 244-248. DOI: 10.3969/j.issn.1673-3193.2020.03.010
作者姓名:张瑞珍  韩跃平  张晓通
作者单位:中北大学 信息与通信工程学院,山西 太原 030051,中北大学 信息与通信工程学院,山西 太原 030051,中北大学 信息与通信工程学院,山西 太原 030051
摘    要:基于长短时记忆(LSTM)神经网络在语音识别方面的良好性能,本文引入了一种新的深度LSTM方法.该方法利用深度控制门控函数连接多层LSTM单元,在循环神经网络中引入了上下层之间的线性相关性,可以更深层地构建语音模型.同时利用链接时序分类的训练准则进行模型训练,搭建端到端语音识别系统,解决了隐马尔可夫模型需要将标签和序列强制对齐的问题.实验表明,深度LSTM可以提高语音建模的性能,相比使用标准LSTM的模型,在准确率方面提高约4%.

关 键 词:语音识别  深度LSTM  链接时序分类  端到端

End-to-End Speech Recognition Based on Depth-Gated LSTM
ZHANG Rui-zhen,HAN Yue-ping,ZHANG Xiao-tong. End-to-End Speech Recognition Based on Depth-Gated LSTM[J]. Journal of North University of China, 2020, 41(3): 244-248. DOI: 10.3969/j.issn.1673-3193.2020.03.010
Authors:ZHANG Rui-zhen  HAN Yue-ping  ZHANG Xiao-tong
Abstract:
Keywords:
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号