首页 | 本学科首页   官方微博 | 高级检索  
     

跨语种民航陆空通话语音识别模型研究
引用本文:刘远庆,郭晓静,张海刚,杨金锋.跨语种民航陆空通话语音识别模型研究[J].计算机应用与软件,2021,38(5):158-163,189.
作者姓名:刘远庆  郭晓静  张海刚  杨金锋
作者单位:中国民航大学计算机科学与技术学院 天津300300;深圳职业技术学院人工智能学院 广东 深圳518055
摘    要:为实现中英文民航陆空通话语音识别,提出一种基于深度学习的跨语种民航陆空通话语音识别方法.基于共享隐层的卷积深度神经网络(CDNN)建立一个跨语种声学模型;将中文音素和英文音素(CMU)融合用于构建混合语言模型;在此基础上将CMU标准英文音素映射为TIMIT标准英文音素重构语言模型用于识别;为了缩短训练和解码的时间,在提取特征阶段加入低帧率.实验结果表明,卷积深度神经网络声学模型可较好地应用于民航陆空通话领域;音素映射方法能够进一步提高识别性能;加入低帧率后有效缩短了训练时间且使词错误率下降到4.28%.

关 键 词:民航陆空通话  跨语种语音识别  卷积深度神经网络  音素融合  低帧率

SPEECH RECOGNITION MODEL OF CROSS-LINGUAL CIVIL AVIATION'S RADIOTELEPHONY COMMUNICATION
Liu Yuanqing,Guo Xiaojing,Zhang Haigang,Yang Jinfeng.SPEECH RECOGNITION MODEL OF CROSS-LINGUAL CIVIL AVIATION'S RADIOTELEPHONY COMMUNICATION[J].Computer Applications and Software,2021,38(5):158-163,189.
Authors:Liu Yuanqing  Guo Xiaojing  Zhang Haigang  Yang Jinfeng
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号