首页 | 本学科首页   官方微博 | 高级检索  
     

添加音素持续时间信息到频谱模型的说话人辨认研究
引用本文:刘大鹏,尾关和彦,朱庆生.添加音素持续时间信息到频谱模型的说话人辨认研究[J].计算机技术与发展,2007,17(5):156-159.
作者姓名:刘大鹏  尾关和彦  朱庆生
作者单位:1. 重庆大学,计算机学院,重庆,400044;电气通信大学,信息通信工程系,日本,东京,182-8585
2. 电气通信大学,信息通信工程系,日本,东京,182-8585
3. 重庆大学,计算机学院,重庆,400044
摘    要:传统的声音识别系统通过短时声音频谱信息来辨识说话人.这种方法在某些条件下具有较好的性能。但是由于有些说话人特征隐藏在较长的语音片段中,通过添加长时信息可能会进一步提高系统的性能。在文中.音素持续时间信息被添加到传统模型上,以提高说话人辨识率。频谱信息是通过短时分析获得的,但音素持续时间的提取却属于长时分析,它需要更多的语音数据。通过大量语音数据探讨了音素持续时间信息对说话人辨识的有效性,提出2种方法来解决数据量小所引起的问题。实验结果表明,当说话人的声音模型被恰当建立时,即使在语音数据量小的情况下,音素持续时间信息对说话人辨识率的提高也是有效的。

关 键 词:说话人声音辨识  高斯混合模型  音素持续时间信息

Adding Phoneme Duration Information to Spectral Model in Speaker Identification
LIU Da-peng,Kazuhiko Ozeki,ZHU Qing-sheng.Adding Phoneme Duration Information to Spectral Model in Speaker Identification[J].Computer Technology and Development,2007,17(5):156-159.
Authors:LIU Da-peng  Kazuhiko Ozeki  ZHU Qing-sheng
Abstract:
Keywords:
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号