摘 要: | 为增强陕北方言识别率,对端到端语音识别技术进行研究,提出基于Conformer的端到端陕北方言语音识别模型。通过研究陕北方言语音特点及在煤矿行业中的使用特点,建立面向陕北煤矿行业的语料库;针对陕北方言和汉语声母韵母的发音差异,通过对比不同特征提取技术在陕北方言识别中的性能,选取适合陕北方言的特征提取技术;设计预处理模块适应陕北方言语速快、多叠词等特点,提高陕北方言语音识别性能。针对Conformer解码器文本生成能力受限的问题,使用Transformer作为解码器;针对模型需大量计算资源的问题,引入CTC联合训练,实现模型的优化。实验结果表明,在面向陕北煤矿行业的自建语音数据集上,与其它主流模型相比,融合Conformer-Transformer-CTC的模型具有先进性。
|