首页 | 本学科首页   官方微博 | 高级检索  
     

利用语音非线性特征改进说话人识别的性能
引用本文:侯丽敏,邓德春,王朔中.利用语音非线性特征改进说话人识别的性能[J].模式识别与人工智能,2006,19(6).
作者姓名:侯丽敏  邓德春  王朔中
作者单位:上海大学,通信与信息工程学院,上海,200072
摘    要:分析说话人发音过程中的非线性现象,通过计算38个汉语音素的最大Lyapunov指数验证语音内含混沌性.从不同侧面讨论语音非线性特征量的物理意义和计算方法,包括Lyapunov指数、二阶熵和相关维数,并将这些非线性特征用于说话人识别.在Gauss混合模型的说话人识别系统中,基于MFCC参数得到识别结果的基础上,用最大Lyapunov指数、二阶熵和相关维数再进行说话人的二次辨认,提高说话人识别的性能.实验结果表明非线性特征参数中包含有说话人特征的信息,因此可用于改进基于MFCC的识别性能.

关 键 词:说话人识别  混沌  最大Lyapunov指数

Improvement of Speaker Identification Performance Using Nonlinear Features
HOU Li-Min,DENG De-Chun,WANG Shuo-Zhong.Improvement of Speaker Identification Performance Using Nonlinear Features[J].Pattern Recognition and Artificial Intelligence,2006,19(6).
Authors:HOU Li-Min  DENG De-Chun  WANG Shuo-Zhong
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号