首页 | 本学科首页   官方微博 | 高级检索  
     

基于语音谐波结构的鲁棒特征参数及其在说话人识别中的应用
引用本文:张玲华,郑宝玉,杨震.基于语音谐波结构的鲁棒特征参数及其在说话人识别中的应用[J].电子与信息学报,2006,28(10):1786-1789.
作者姓名:张玲华  郑宝玉  杨震
作者单位:南京邮电大学通信与信息工程学院,南京,210003;南京邮电大学通信与信息工程学院,南京,210003;南京邮电大学通信与信息工程学院,南京,210003
基金项目:江苏省教育厅青蓝工程项目;南京邮电大学校科研和教改项目
摘    要:通过对纯净语音及含噪语音短时谱的分析比较,提出了一种基于基音频率及其谐波结构的新的语音特征参数。实验表明,与传统的倒谱特征相比,新特征对加性白噪声相对较不敏感,在闭集文本无关说话人识别中,新特征可以在加性白高斯噪声环境下提高系统的说话人识别率。

关 键 词:说话人识别  短时谱  谐波特征  基音频率
文章编号:1009-5896(2006)10-1786-04
收稿时间:2005-02-21
修稿时间:2005-10-31

Robust Feature Based on Speech Harmonic Structure for Speaker Identification
Zhang Ling-hua,Zheng Bao-yu,Yang Zhen.Robust Feature Based on Speech Harmonic Structure for Speaker Identification[J].Journal of Electronics & Information Technology,2006,28(10):1786-1789.
Authors:Zhang Ling-hua  Zheng Bao-yu  Yang Zhen
Affiliation:College of Communication and Information Engineering, Nanjing Univ. of Posts & Telecomms., Nanjing 210003, China
Abstract:An effective and robust speech feature extraction method based on pitch frequency and harmonic structure is proposed by means of short-time spectrum analysis of clear and noisy speech. Experimental results indicate that the new feature is relatively insensitive to Additive White Gaussian Noise (AWGN). Compared to conventional cepstrums, the new feature can give outstanding improvement for closed-set text-independent speaker identification under noisy environments corrupted by AWGN.
Keywords:Speaker identification  Short-time spectrum  Harmonic feature  Pitch frequency
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《电子与信息学报》浏览原始摘要信息
点击此处可从《电子与信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号