基于双路卷积神经网络的中文语音识别期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于双路卷积神经网络的中文语音识别

引用本文：	张昱,李鸿燕,邢璐,任健.基于双路卷积神经网络的中文语音识别[J].计算机工程与设计,2023(3):880-886.

作者姓名：	张昱李鸿燕邢璐任健

作者单位：	太原理工大学信息与计算机学院

基金项目：	山西省自然科学基金项目(201701D121058)；;山西省回国留学科研基金项目(2020-042)；

摘要：	为解决卷积神经网络在中文语音识别中识别准确率低、鲁棒性差的问题，提出一种基于双路卷积神经网络的声学建模方法。利用多尺度学习方法提取多尺度特征信息；将软阈值非线性转换层和注意力机制进行融合后嵌入残差网络，减轻网络梯度问题，加强网络特征信息传递，提高特征学习效果；采用连接时序分类技术分类，简化语音识别流程。实验结果表明，该模型与传统识别模型相比，词错误率降低了7.52%,在3种噪声环境下，错误率也低于传统模型。
关键词：	语音识别多尺度学习软阈值注意力机制残差网络连接时序分类端到端