首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 78 毫秒
1.
基于MFCC的说话人识别系统   总被引:9,自引:0,他引:9  
说话人识别可以被看作语音识别的一种,是当前的研究热点之一.本文实现的说话人辨认系统,采用能够反映人对语音的感知特性的Mel频率倒谱系数(Mel-Frequency Ceptral Coefficients ,MFCC)作为特征参数.试验比较了MFCC、差分MFCC组合MFCC分别与VQ、DTW相结合的识别率.得出差分MFCC组合MFCC优于MFCC.  相似文献   

2.
噪声环境下,为了提高说话人识别系统的鲁棒性,需要对系统进行各种抗噪声处理。采用梅尔频率倒谱系数作为语音的特征参数,矢量量化方法进行模式匹配,将改进的基于听觉掩蔽效应的语音增强器作为预处理器,对语音信号首先进行降噪处理。语音增强器实验结果表明,经过降噪处理后提高了输入信号的信噪比,减少了语音失真,同时很好地抑制了背景噪声和残余音乐噪声。将经过降噪处理的语音信号送入说话人识别系统,提高了系统的识别性能。  相似文献   

3.
檀蕊莲 《信息技术》2010,34(8):103-104
说话人识别是语音识别的一种特殊方式,其目的不是识别语音内容,而是识别说话人是谁,即从语音信号中提取个人特征。采用矢量量化(VQ)可避免困难的语音分段问题和时间归整问题,且作为一种数据压缩手段可大大减少系统所需的数据存储量。通过说话人识别相关技术的研究,提出并设计了一个基于VQ的说话人识别系统,实验证明,当用于训练的数据量较小时,可以得到比较稳定的识别性能。  相似文献   

4.
提出了一种新的适用于离散HMM说话人辨认系统的VQ码本训练方法,码本的训练准则是使码本中各码字的利用率趋于均等.将新方法训练的码本与用LBG算法训练的码本进行了比较,实验表明,在基于离散HMM的说话人辨认系统中,用新方法训练的码本性能优于用LBG算法训练的码本,特别是在与文本无关的情况下,使系统的正确辨认率显著提高.  相似文献   

5.
论文通过提取输入语音的美尔倒谱系数,线性预测倒谱系数及其差分的双重方法,在建模过程中,对原有的矢量量化模型进行改进,形成一种新的连续码字分布的矢量量化模型,并与传统的动态时间规整算法和矢量量化方法比较,进行与文本有关的说话人识别实验,获得了较好的效果。  相似文献   

6.
文中以语音信号的LPC倒谱系数、△倒谱系数、基音周期和△基音周期的混合特征参数作为识别说话人的特征,运用VQ技术实现了说话人自动识别。在10个说话人,1800个汉语数字和单词语音的语音库上进行了系统的识别实验,其中单音节语音的平均识别率达到了92%,双音节语音达到了96.67%,四音节语音达到了97.67%。  相似文献   

7.
作为说话人识别特征参量的MFCC的提取过程   总被引:5,自引:0,他引:5  
说话人识别是人的个体特征识别中的一个重要分支,在实际生活中已得到广泛应用。而人的听觉系统是一个比较理想的说话人识别系统,MFCC(Mel倒谱系数)模拟了人的听觉特性,是符合人听觉特性的语音特征参量,在实际应用中取得了较高的识别率。文中通过一个卷积同态系统简单介绍了语音信号的倒谱分析方法,并通过对Mel频率刻度得到符合人听觉特性的Mel频率等效滤波器组,最后介绍了MFCC求取的一般过程和算法。  相似文献   

8.
说话人识别系统研究   总被引:1,自引:0,他引:1  
张东阳  张国杰 《通信技术》2007,40(11):356-358
说话人识别是指通过说话人的语音来自动识别出说话人的身份.这种识别系统在许多领域内有着良好的应用前景.文中回顾了说话人识别技术的发展历史,阐述了说话人识别技术的基本原理以及与语音识别技术的区别,介绍了识别技术的几种分类.文中重点介绍了说话人识别的相关技术:特征提取和模式匹配.描述了特征提取和模式匹配各自的任务和特点,强调了它们在说话认识别系统中的关键性作用.  相似文献   

9.
提取特征参数在说话人识别系统内是非常重要的步骤,说话人语音的很多特有个性信息包含于特征参数内,例如发声特征或者语义特征,利用特征提取的方法一方面可以去掉声音里没用的冗余信息,剩下有用的体现说话人个性不同的特征信息,特别是可以有效减少计算量、模板数目以及存储空间。选用的特征参数的会直接关系到整个系统的工作性能,良好的特征参数需要拥有好的稳定性和好的独立性,一方面可以不受到外界情况的干扰,不容易为其他的声音所替代,另一方面,能够较好的辨别不同说话人,说明说话人之间的差异。  相似文献   

10.
基于MVQM说话人识别系统的DSP实现   总被引:1,自引:1,他引:0  
文章运用TMS320C5416实现了说话人自动识别系统。提出了一种新的说话人识别方法。该方法综合了VQ和GMM的优点。通过用VQ误差尺度取代传统GMM的输出概率函数。减少了建模时对训练数据量的要求,提高了识别速度。实验结果证明该方法是有效的。  相似文献   

11.
但志平  刘勇  田卫新  胡刚 《电声技术》2007,31(5):60-62,77
讨论了以二次等式约束条件为基础的一种改进的向量机即最小二乘向量机(LSSVM)算法,用其对话者进行识别,并与传统的支持向量机(SVM)进行了识别比较。实验中,采用美尔倒谱系数(MFCC)作为话者语音特征参数。实验表明,基于LSSVM的话者识别比传统的SVM话者识别计算复杂度小,训练时间短,效率更高;同时,识别率也有一定的提高,对话者识别有很强的适应性。  相似文献   

12.
基于小波包分析特征参数的说话人识别系统   总被引:5,自引:0,他引:5  
李战明  王贞 《电声技术》2005,(6):46-49,55
介绍了说话人识别系统,研究MFCC提取原理与小波包分析的基础上,提出了一种基于小波包分析的新型语音特征参数WPDC。在研究了WPDC提取算法的基础上,建立了一个神经网络模型的说话人识别系统,实验比较了MFCC与WPDC的识别性能,验证WPDC了具有很高的识别率,是一种很好的语音特征参数。  相似文献   

13.
在语音识别中,MFCC 参数是说话人识别中常用的特征参数之一。文中针对说话人识别速度较慢以及占用资源较大的问题,提出了一种 MFCC 计算的有效方案。利用 MFCC 滤波器的频率响应函数的三角形结构,改进了 Mel 滤波器的设计方法。实验结果表明,文中所提方案在单帧内存访问时间上减少了 83.6%,在保证识别准确率不降低的情况下,使识别速度大幅度提高,降低了说话人识别计算的复杂性。  相似文献   

14.
在说话人识别系统中,能够反映说话人个性的语音特征参数是系统的关键问题之一。本文提出了一种新的说话人识别方法:在小波变换的基础上,借鉴MFCC特征参数的提取,基于GMM模型,用小波包变换代替傅立叶变换,提取新的特征参数DWPTMFCC,实验结果表明,该方法简单可靠,有效可行,具有较高的识别率,与已有方法相比,具有广泛的实用性。  相似文献   

15.
陈雁翔  刘鸣 《电子学报》2010,38(12):2920-2924
 人类对语音的感知是多模态的,会同时受到听觉和视觉的影响.以语音及其视觉特征的融合为研究核心,依据发音机理中揭示的音视频之间非同步关联的深层次成因,采用多个发音特征的非同步关联,去描述表面上观察到的音视频之间的非同步,提出了一个基于动态贝叶斯网络的语音与唇动联合模型,并通过音视频双模态的多层次融合,实现了说话人识别系统鲁棒性的提高.音视频双模态数据库上的实验表明了,在不同语音信噪比的条件下多层次融合均达到了更好的性能.  相似文献   

16.
说话人识别综述   总被引:2,自引:0,他引:2  
在分析说话人识别原理和方法的基础上,对近年来说话人识别技术的发展进行了综述。分析了当前说话人识别技术中使用的多种特征和模式识别方法,并对其今后的研究前景和发展方向进行了展望。  相似文献   

17.
介绍了说话人识别技术的基本概念和发展历史,列举并比较了几种常用的特征提取和模式匹配方法,总结了当前存在的问题并对其发展进行了展望.  相似文献   

18.
与文本无关的说话人识别系统的设计   总被引:1,自引:0,他引:1  
王书诏  邱天爽 《电声技术》2006,(12):51-52,58
说话人识别是语音信号处理中的重要组成部分,是当前的研究热点之一。详细介绍了说话人识别系统的基本原理和研究现状,并在此基础上对多种可能的特征参数、训练模型和分类方法进行比较和选择,设计出一个识别率高、计算量小的说话人识别系统,识别系统采用MATLAB完成开发,仿真结果显示系统取得了较好的实验结果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号