首页 | 本学科首页   官方微博 | 高级检索  
     

基于动态贝叶斯网络的大词汇量连续语音识别和音素切分研究
引用本文:吕国云,蒋冬梅,张艳宁,赵荣椿,Hichem Sahli.基于动态贝叶斯网络的大词汇量连续语音识别和音素切分研究[J].西北工业大学学报,2008,26(2):173-178.
作者姓名:吕国云  蒋冬梅  张艳宁  赵荣椿  Hichem Sahli
作者单位:1. 西北工业大学,计算机学院,陕西,西安,710072
2. 布鲁塞尔自由大学,电子与信息处理系,比利时,布鲁塞尔B-1050
基金项目:中国科技部与比利时国际合作项目
摘    要:提出一个新颖的单流多状态动态贝叶斯网络(Single stream Multi-states Dynamic Bayesian Network, SM-DBN)模型,以实现大词汇量连续语音识别和音素切分.该模型在Bil m es等人提出的单流动态贝叶斯网络(Single stream Dynamic Bayesian Network, Phone-sh ared,SS-DBN-P)模型(识别基元为词)基础上,增加了一个隐含的状态节点层,每个词由它的对 应音素组成,而音素采用固定个数的状态描述,状态和观测向量直接连接.它的识别基元为音 素,描述了音素的动态发音变化过程.大词汇量语音识别的实验结果表明:在纯净语音环境下 ,SM-DBN模型的识别率比HMM和SS-DBN-P模型的识别率分别提高了13.01%和35.2%,而 音频流的音素切分正确率则分别提高了10%和44%.

关 键 词:动态贝叶斯网络音视频语音识别音素切分  动态贝叶斯网络  大词汇量  连续  语音识别  音素  研究  Segmentation  Phone  Continuous  Speech  Recognition  Model  正确率  音频流  识别率  语音环境  纯净  结果  实验  变化过程  发音  状态描述
文章编号:1000-2758(2008)02-0173-06
修稿时间:2007年3月7日

A Novel SM-DBN Model for Large-Vocabulary Continuous Speech Recognition and Phone Segmentation
Lu Guoyun,Jiang Dongmei,Zhang Yanning,Zhao Rongchun,Hichem Sahli.A Novel SM-DBN Model for Large-Vocabulary Continuous Speech Recognition and Phone Segmentation[J].Journal of Northwestern Polytechnical University,2008,26(2):173-178.
Authors:Lu Guoyun  Jiang Dongmei  Zhang Yanning  Zhao Rongchun  Hichem Sahli
Abstract:
Keywords:
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号