首页 | 本学科首页   官方微博 | 高级检索  
     

基于对话语音的与文本无关的说话人确认系统的研究
引用本文:陈雁翔,戴蓓倩,周曦,李辉.基于对话语音的与文本无关的说话人确认系统的研究[J].中文信息学报,2004,18(2):37-44.
作者姓名:陈雁翔  戴蓓倩  周曦  李辉
作者单位:1.中国科学技术大学电子科学与技术系2.合肥工业大学计算机与信息学院
基金项目:国家自然科学基金,安徽省自然科学基金
摘    要:本文建立了一个基于对话语音的与文本无关的说话人确认系统,它和传统的与文本无关的说话人确认系统的关键不同在于,训练及测试语音不再只包含一个人而都是对话语音,因此需要分割出属于不同说话人的语音段,以建立说话人模型和实现最终判决。文中详细介绍了高斯混合模型-背景模型(GMM-UBM)这种说话人确认系统的框架,重点讨论了基于GLR(Generalized Likelihood Ratio)距离测度的无监督语音分割算法。最终阐述的输出评分的规整方法即ZNORM(Zero Normalization)和持续时间修正,可以使确认系统的性能提高近10%。

关 键 词:计算机应用  中文信息处理  对话语音  GLR距离测度  无监督语音分割  
文章编号:1003-0077(2004)02-0036-08
修稿时间:2003年8月11日

A Study on the Text-independent Speaker Verification System Based on Conversation
CHENG Yan-xiang ,DAI Bei-qian ,ZHOU Xi ,LI Hui.A Study on the Text-independent Speaker Verification System Based on Conversation[J].Journal of Chinese Information Processing,2004,18(2):37-44.
Authors:CHENG Yan-xiang    DAI Bei-qian  ZHOU Xi  LI Hui
Affiliation:1.Dept. of Electronic Science & Technology , University of Science & Technology of China2.College of Computer Science & Information , Hefei Universit y of Technology
Abstract:In this paper, a text-independent speaker verification system is proposed based on conversation. The key difference between this system and the conventional 1-speaker verification system is that the speech for training and testing is conversation. So speech segmentation based on speakers is applied to train the speakers'models and make the final decision. The GMM-UBM frame is introduced while an unsupervised speech segmentation algorithm based on GLR distance measure is emphasized. Then the normalization of score including ZNORM and duration penalty results in improvement of performance by 10%.
Keywords:computer application  Chinese information processing  conversation  GLR distance measure  unsupervised speech segmentation
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号