首页 | 本学科首页   官方微博 | 高级检索  
     

面向陕北方言的端到端语音识别模型研究
作者姓名:于非凡  董立红  秦昳  翟蒙恩
作者单位:西安科技大学计算机科学与技术学院
基金项目:陕西省自然科学基础研究计划项目 2019JLM-11;陕西省教育厅科研计划专项项目 8146119003;煤炭行业教育研究课题 2021MXJG020;陕西省高等教育学会2021年度高等教育科学研究项目 XGH21109;陕西省高等教育学会2019年度高等教育科学研究项目 XGH19120
摘    要:为增强陕北方言识别率,对端到端语音识别技术进行研究,提出基于Conformer的端到端陕北方言语音识别模型。通过研究陕北方言语音特点及在煤矿行业中的使用特点,建立面向陕北煤矿行业的语料库;针对陕北方言和汉语声母韵母的发音差异,通过对比不同特征提取技术在陕北方言识别中的性能,选取适合陕北方言的特征提取技术;设计预处理模块适应陕北方言语速快、多叠词等特点,提高陕北方言语音识别性能。针对Conformer解码器文本生成能力受限的问题,使用Transformer作为解码器;针对模型需大量计算资源的问题,引入CTC联合训练,实现模型的优化。实验结果表明,在面向陕北煤矿行业的自建语音数据集上,与其它主流模型相比,融合Conformer-Transformer-CTC的模型具有先进性。

关 键 词:语音识别  陕北方言  煤矿行业  端到端  连接时序分类  
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号