首页 | 本学科首页   官方微博 | 高级检索  
     

基于“码袋”算法的话者自动辨认系统
引用本文:陈哲,顾明亮,王劲松,冯静兰,杨亦鸣. 基于“码袋”算法的话者自动辨认系统[J]. 声学技术, 2010, 29(2): 188-191. DOI: 10.3969/j.issn1000-3630.2010.02.015
作者姓名:陈哲  顾明亮  王劲松  冯静兰  杨亦鸣
作者单位:1. 江苏省语言科学与神经认知工程重点实验室,江苏徐州,221116
2. 徐州师范大学物理与电子工程学院,江苏徐州,221116;江苏省语言科学与神经认知工程重点实验室,江苏徐州,221116
3. 徐州师范大学物理与电子工程学院,江苏徐州,221116
基金项目:徐州师范大学研究生创新计划 
摘    要:在话者自动辨认系统中,话者数量是决定辨认时间的最主要因素。因而在大数量注册话者的辨认中如何减少辨认所需要的运算时间是一个关键问题。针对这一问题,提出了一种新的基于"码袋"的话者模型设计算法,它通过统计"码袋"中每个码字在话者语音中的概率分布来实现话者模型的设计。实验结果表明该算法在保证较高辨认率的同时,有效地降低了话者自动辨认系统的计算复杂度。

关 键 词:码袋  矢量量化  话者自动辨认
收稿时间:2009-03-15
修稿时间:2009-05-23

Automatic speaker identification based on"bag of codes"
CHEN Zhe,GU Ming-liang,WANG Jin-song,FENG Jing-lan and YANG Yi-ming. Automatic speaker identification based on"bag of codes"[J]. Technical Acoustics, 2010, 29(2): 188-191. DOI: 10.3969/j.issn1000-3630.2010.02.015
Authors:CHEN Zhe  GU Ming-liang  WANG Jin-song  FENG Jing-lan  YANG Yi-ming
Affiliation:CHEN Zhe2,GU Ming-liang1,2,WANG Jin-song1,FENG Jing-lan2,YANG Yi-ming2(1.School of Phusics , Electronic Engineering,Xuzhou Normal Universitu,Xuzhou 221116,Jiangsu,China,2.Jiangsu Key Laboratory of Language Science , Neural Cognition Engineer,China)
Abstract:The most dominating factor of the identification time is the number of speakers.Thus, how to reduce the computational cost of evaluating large speaker database is the key problem.Due to this, abag of codesalgorithm is proposed.This novel algorithm can generate speaker models by estimating the probability distribution of codes in speech data.Experiments prove that the new algorithm can reduce the computational complexity in the speaker identification system with high identification accuracy.
Keywords:bag of codes  vector quantization  automatic speaker identification  
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《声学技术》浏览原始摘要信息
点击此处可从《声学技术》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号