首页 | 本学科首页   官方微博 | 高级检索  
     

一种基于MASM的口形轮廓特征提取方法及听视觉语音识别
引用本文:谢磊,冯伟,赵荣椿.一种基于MASM的口形轮廓特征提取方法及听视觉语音识别[J].西北工业大学学报,2004,22(5):674-678.
作者姓名:谢磊  冯伟  赵荣椿
作者单位:西北工业大学,计算机学院,陕西,西安,710072
基金项目:中国科技部与比利时弗拉芒大区国际科技合作项目 (国科外 19990 2 0 9号 )资助
摘    要:提出了一种用于听视觉语音识别的基于MASM的口形轮廓提取方法,这种方法只需要少量的训练数据就可以实现对大量口形轮廓的准确提取。还引入了一种口形轮廓的平滑修正方法,该方法利用口形连续变化的特点,对错误轮廓进行修正。实验证明,利用该方法提取轮廓的准确率比常规ASM模型高出20个百分点;将该口形轮廓特征引入到听视觉语音识别中,可以有效地提高噪音环境下的识别率。

关 键 词:语音识别  听视觉语音识别  ASM  MASM  口形轮廓提取
文章编号:1000-2758(2004)05-0674-05
修稿时间:2003年9月10日

A Lip Contour Extraction Method Based on Multiple Active Shape Model (MASM) for Audio Visual Speech Recognition
Xie Lei,Feng Wei,Zhao Rongchun.A Lip Contour Extraction Method Based on Multiple Active Shape Model (MASM) for Audio Visual Speech Recognition[J].Journal of Northwestern Polytechnical University,2004,22(5):674-678.
Authors:Xie Lei  Feng Wei  Zhao Rongchun
Abstract:
Keywords:speech recognition  audio visual speech recognition  ASM(Active Shape Model)  MASM(Multiple Active Shape Model)  lip contour extraction
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号