基于动态贝叶斯网络的大词汇量连续语音识别和音素切分研究 A Novel SM-DBN Model for Large-Vocabulary Continuous Speech Recognition and Phone Segmentation期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于动态贝叶斯网络的大词汇量连续语音识别和音素切分研究

引用本文：	吕国云,蒋冬梅,张艳宁,赵荣椿,Hichem Sahli.基于动态贝叶斯网络的大词汇量连续语音识别和音素切分研究[J].西北工业大学学报,2008,26(2):173-178.

作者姓名：	吕国云蒋冬梅张艳宁赵荣椿 Hichem Sahli

作者单位：	1. 西北工业大学,计算机学院,陕西,西安,710072 2. 布鲁塞尔自由大学,电子与信息处理系,比利时,布鲁塞尔B-1050

基金项目：	中国科技部与比利时国际合作项目

摘要：	提出一个新颖的单流多状态动态贝叶斯网络(Single stream Multi-states Dynamic Bayesian Network, SM-DBN)模型,以实现大词汇量连续语音识别和音素切分.该模型在Bil m es等人提出的单流动态贝叶斯网络(Single stream Dynamic Bayesian Network, Phone-sh ared,SS-DBN-P)模型(识别基元为词)基础上,增加了一个隐含的状态节点层,每个词由它的对应音素组成,而音素采用固定个数的状态描述,状态和观测向量直接连接.它的识别基元为音素,描述了音素的动态发音变化过程.大词汇量语音识别的实验结果表明:在纯净语音环境下 ,SM-DBN模型的识别率比HMM和SS-DBN-P模型的识别率分别提高了13.01%和35.2%,而音频流的音素切分正确率则分别提高了10%和44%.
关键词：	动态贝叶斯网络音视频语音识别音素切分动态贝叶斯网络大词汇量连续语音识别音素研究 Segmentation Phone Continuous Speech Recognition Model 正确率音频流识别率语音环境纯净结果实验变化过程发音状态描述
文章编号：	1000-2758(2008)02-0173-06
修稿时间：	2007年3月7日
A Novel SM-DBN Model for Large-Vocabulary Continuous Speech Recognition and Phone Segmentation

Lu Guoyun,Jiang Dongmei,Zhang Yanning,Zhao Rongchun,Hichem Sahli.A Novel SM-DBN Model for Large-Vocabulary Continuous Speech Recognition and Phone Segmentation[J].Journal of Northwestern Polytechnical University,2008,26(2):173-178.

Authors:	Lu Guoyun Jiang Dongmei Zhang Yanning Zhao Rongchun Hichem Sahli

Abstract:

Keywords:
本文献已被维普万方数据等数据库收录！

设为首页 | 免责声明 | 关于勤云 | 加入收藏