首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 62 毫秒
1.
矢量量化与神经网络相结合的说话人识别系统   总被引:2,自引:0,他引:2  
李战明  王贞 《计算机工程与应用》2006,42(15):204-206,230
介绍了说话人识别系统的基本概念,在分析了传统VQ模型与神经网络模型的基础上,提出了一种VQ与神经网络相结合的说话人识别系统模型。通过提取出的特征参数(MFFC),建立系统模型,实验证明了该模型性能随着时间的变化有较好的稳定性。  相似文献   

2.
该文研究了在基于矢量量化的说话人识别方法中采用加权的失真测度对识别率的影响。在采用加权欧氏距离失真测度时,利用特征参数的离散程度来确定权值,提出了基于标准差的加权失真测度和基于方差的加权失真测度。实验结果表明,在以MFCC为特征参数的说话人识别系统中,使用这两种算法均可以提高识别率。  相似文献   

3.
基于MFCC和加权矢量量化的说话人识别系统   总被引:14,自引:4,他引:14  
文章介绍的说话人识别系统,采用能够反映人对语音的感知特性的Mel频率倒谱系数(Mel-FrequencyCeptralCoefficients,MFCC)作为特征参数,同时考虑到特征参数各维分量对于不同说话人的区分程度,采用加权的办法进行矢量量化。取得了很好的结果,系统训练和识别计算量和存储量都比较低。  相似文献   

4.
屈微  刘贺平 《计算机应用》2005,25(10):2401-2403
使用独立分量分析(ICA)来提取说话人特征并与矢量量化(VQ)判决方法相结合,实现了一个高性能的基于ICA特征的VQ (ICA VQ)说话人识别系统。通过ICA变换得到说话人语音特征基函数系数用于生成VQ码书,并导出包含能量失真的ICA VQ码书失真测度和质心确定条件,生成最终的判决。仿真实验中ICA提取的特征分别用于不同系统实现说话人确认任务,各系统的DET曲线对比验证了VQ方法用于ICA特征分类判决的优势,同时不同码书尺寸下的等差率(EER)对比证明了VQ码书设计的有效性。  相似文献   

5.
基于序贯判决法的自动说话人识别   总被引:2,自引:0,他引:2  
潘洁 《微机发展》2000,10(1):46-48
本文介绍了一种在微型计算机上实现的与文本无关的自动说话人识别系统。系统采用了一种经距离加权的矢量量化方法,提出了用于识别过程的序贯判决法,从而提高了系统识别率,并大大减少了识别系统的计算量。  相似文献   

6.
为解决采用矢量量化的方法进行说话人识别时出现的失真问题,根据汉语语音的发音特性,提出了将矢量量化与语音特征的聚类技术相结合的方法,在进行矢量量化码书训练之前,先对特征矢量进行聚类筛选。实验结果表明,当测试语音片段长度为4 s时,在保持95%左右识别率下,采用普通矢量量化方法需64码本数,而采用该文方法只需8码本数,降低了8倍。结果说明该方法不但在一定程度上解决了因训练样本不足而引起的失真问题,而且通过方法的改进,实现了采用较低码字数产生较好的识别结果,从而提高识别效率。  相似文献   

7.
基于动态阈值失量量化的说话人识别   总被引:2,自引:0,他引:2  
在基于矢量量化的说话识别系统所选用的LBG算法中,码本分裂时的阈值是影响初始码本生成的重要因素之一, 而传统方式所采用的阈值不容易确定,且需要进行大量的实验来获得经验值。提出在一定范围内动态地,随机地产生阈值的方法来改进初始码本形成策略,并结合差分倒谱参数建立说话人识别模型。实验结果表明该方法在识别率得到一定改善的前提下,训练时间及识别时间有了明显改善。  相似文献   

8.
文本无关的说话人识别:综述   总被引:2,自引:0,他引:2  
本文介绍了说话人识别的基本概念和应用前景,分析了说话人识别的技术难点,详细讨论了说话人语音特征的提取方法和说话人识别方法并简要介绍了作者的工作.  相似文献   

9.
本文对神经网络语音识别中的语音特征提取、网络结构以及学习算法进行了初步的研究,提出了一种用于时特征矢量量化的简化和改进的自组织神经网络模型VQNN。VQNN中引入了动态规划法估计语音样本矢量的码本类中心初值并确定网络的初始权矩阵,可构造出256个量化等级的码本矢量。该方法具有较强的鲁棒性且矢量量化过程简单迅速。对28个地名的语音量化识别实验结果表明了这种量化方法对时识别的有性。  相似文献   

10.
说话人识别综述   总被引:1,自引:0,他引:1  
在分析说话人识别原理的基础上,分别从说话人识别的特征提取、说话人模型等方面进行了综述,并讨论了说话人识别的优点和不足,展望了其应用研究的前景。  相似文献   

11.
在TI的DSK5402平台上构建了一个主要采用VQ方法的6个说话人识别系统。该系统采用了10阶的线性预测参数、10阶的线性预测倒谱参数及基音参数,提出了一种改进的LBG算法,以避免在迭代过程中产生空胞腔,使之能适应多种距离测量。实验证明,本系统在指定文本的说话人闭集测试中取得了满意的效果。  相似文献   

12.
目前,基于PC或DSP的系统其处理能力无法满足海量语音信号高速处理需求的增长。本文分析了VQ(矢量量化)搜索算法的硬件实现复杂度,针对说话人识别过程中运算量最大、耗时最长的判决过程,提出了一种基于标签的说话人判决模型实现方案。该设计用FPGA实现,可对多路电话信道说话人进行实时判决识别。  相似文献   

13.
与文本无关的说话人识别具有用户使用方便、可应用范围较宽等优点,是当前说话人识别技术的研究重点。对文本无关说话人识别系统中的特征参数提取进行了研究,通过对Mel子带系数进行修正,增强了说话人识别系统中说话人之间的频带差异,提高了特征空间中类别的可分性,得到了更能体现说话人个性特征的Mel子带系数,从而提高了说话人识别系统的平均正确识别率。  相似文献   

14.
为了解决特征提取计算量大且特征参数不够全面的问题,提出了用主成分分析和K-means聚类进行语音特征参数提取的方法。通过对说话人识别系统中最常用的线性预测倒谱系数( LPCC)参数和梅尔倒谱系数( MFCC)参数提取原理以及差分参数的提取算法深入研究,选择LPCC、MFCC以及其一阶差分参数的组合作为最终混合特征参数。首先用主成分分析降低每一帧语音信号特征参数的阶数,然后经过K-means聚类降低帧数,最后通过矢量量化( VQ)来进行说话人识别。实验结果表明,该方法降低了计算复杂度,同时也提升了识别准确性。  相似文献   

15.
一种基于MFCC和LPCC的文本相关说话人识别方法   总被引:1,自引:0,他引:1  
于明  袁玉倩  董浩  王哲 《计算机应用》2006,26(4):883-885
在说话人识别的建模过程中,为传统矢量量化模型的码字增加了方差分量,形成了一种新的连续码字分布的矢量量化模型。同时采用美尔倒谱系数及其差分和线性预测倒谱系数及其差分相结合作为识别的特征参数,来进行与文本有关的说话人识别。通过与动态时间规整算法和传统的矢量量化方法进行比较表明,在系统响应时间并未明显增加的基础上,该模型识别率有一定提高。  相似文献   

16.
针对实时性问题提出了一种以FPGA为硬件平台的说话人识别系统解决方案。该方案以MFCC为语音特征,采用了基于矢量量化的说话人识别算法。系统主要包括语音信号采集、端点检测、特征提取和识别判断4个部分。经测试证明,该系统完成了设计所需的基本功能。在实验室条件下,当系统时钟为50 MHz时,完成一次4码的识别耗时15.932 ms,对12码的识别率为93.3%。  相似文献   

17.
说话人识别是目前身份认证及人工智能领域研究的一个热点,解决说话人识别问题具有重要的理论价值和深远的实用意义.基于语音鲜明个性特征和显著的性别差异,提出了一种考虑性别差异的说话人识别方法,并采用SVM分类器进行训练和测试.先对SVM分类器分别进行性别识别训练和同性集合内个体识别的分类训练,建立起相应的支持向量集合,以此为基础,先后进行说话人的性别识别测试和个体识别测试.实验结果表明,该方法可以有效提高闭集说话人识别系统的性能.  相似文献   

18.
GMM文本无关的说话人识别系统研究   总被引:3,自引:2,他引:1       下载免费PDF全文
在高斯混合模型(Gaussian Mixture Model,GMM)训练时,对传统的模型参数初始化方法(随机法、K均值聚类法)进行改进,提出分裂法与K均值聚类相结合的新方法。实验表明,采用改进的方法与传统方法相比,系统平均识别率有15.47%和7.5%的提高。研究了GMM的阶数、协方差阈值、预加重系数对系统识别率的影响。对实验结果进行详细分析,并根据实验数据,取它们各自表现最好的值,从而使构建的说话人识别系统获得一个较高的识别率。实验表明,在规定的实验条件下,系统可达到90%以上的识别率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号