添加音素持续时间信息到频谱模型的说话人辨认研究 Adding Phoneme Duration Information to Spectral Model in Speaker Identification期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

添加音素持续时间信息到频谱模型的说话人辨认研究

引用本文：	刘大鹏,尾关和彦,朱庆生.添加音素持续时间信息到频谱模型的说话人辨认研究[J].计算机技术与发展,2007,17(5):156-159.

作者姓名：	刘大鹏尾关和彦朱庆生

作者单位：	1. 重庆大学,计算机学院,重庆,400044;电气通信大学,信息通信工程系,日本,东京,182-8585 2. 电气通信大学,信息通信工程系,日本,东京,182-8585 3. 重庆大学,计算机学院,重庆,400044

摘要：	传统的声音识别系统通过短时声音频谱信息来辨识说话人．这种方法在某些条件下具有较好的性能。但是由于有些说话人特征隐藏在较长的语音片段中，通过添加长时信息可能会进一步提高系统的性能。在文中．音素持续时间信息被添加到传统模型上，以提高说话人辨识率。频谱信息是通过短时分析获得的，但音素持续时间的提取却属于长时分析，它需要更多的语音数据。通过大量语音数据探讨了音素持续时间信息对说话人辨识的有效性，提出2种方法来解决数据量小所引起的问题。实验结果表明，当说话人的声音模型被恰当建立时，即使在语音数据量小的情况下，音素持续时间信息对说话人辨识率的提高也是有效的。
关键词：	说话人声音辨识高斯混合模型音素持续时间信息
Adding Phoneme Duration Information to Spectral Model in Speaker Identification

LIU Da-peng,Kazuhiko Ozeki,ZHU Qing-sheng.Adding Phoneme Duration Information to Spectral Model in Speaker Identification[J].Computer Technology and Development,2007,17(5):156-159.

Authors:	LIU Da-peng Kazuhiko Ozeki ZHU Qing-sheng

Abstract:

Keywords:
本文献已被维普万方数据等数据库收录！

设为首页 | 免责声明 | 关于勤云 | 加入收藏