基于双路卷积神经网络的中文语音识别 |
| |
引用本文: | 张昱,李鸿燕,邢璐,任健.基于双路卷积神经网络的中文语音识别[J].计算机工程与设计,2023(3):880-886. |
| |
作者姓名: | 张昱 李鸿燕 邢璐 任健 |
| |
作者单位: | 太原理工大学信息与计算机学院 |
| |
基金项目: | 山西省自然科学基金项目(201701D121058);;山西省回国留学科研基金项目(2020-042); |
| |
摘 要: | 为解决卷积神经网络在中文语音识别中识别准确率低、鲁棒性差的问题,提出一种基于双路卷积神经网络的声学建模方法。利用多尺度学习方法提取多尺度特征信息;将软阈值非线性转换层和注意力机制进行融合后嵌入残差网络,减轻网络梯度问题,加强网络特征信息传递,提高特征学习效果;采用连接时序分类技术分类,简化语音识别流程。实验结果表明,该模型与传统识别模型相比,词错误率降低了7.52%,在3种噪声环境下,错误率也低于传统模型。
|
关 键 词: | 语音识别 多尺度学习 软阈值 注意力机制 残差网络 连接时序分类 端到端 |
|
|