首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 186 毫秒
1.
与文本无关的说话人识别具有用户使用方便、可应用范围较宽等优点,是当前说话人识别技术的研究重点。对文本无关说话人识别系统中的特征参数提取进行了研究,通过对Mel子带系数进行修正,增强了说话人识别系统中说话人之间的频带差异,提高了特征空间中类别的可分性,得到了更能体现说话人个性特征的Mel子带系数,从而提高了说话人识别系统的平均正确识别率。  相似文献   

2.
连续隐马尔可夫模型(CHMM)和人工神经网络(ANN)广泛的应用于说话人识别系统中,本文分别建立基于这两种模型的说话人识别系统,提取感知谐波倒谱系数作为与文本有关的说话人识别的特征参数,并分别在理想和噪声环境下仿真比较。实验结果表明ANN和CHMM模型在理想环境下平均识别率基本一致,而在噪声环境下ANN模型鲁棒性明显优于CHMM模型,识别率较高。  相似文献   

3.
在噪声环境中如何提高说话人识别精度是说话人识别研究中的一个非常重要的课题。为了让说话人识别系统在安静的环境和噪声环境中都能取得满意的工作性能,研究一个将语音增强器与说话人识别器级连起来的系统。该系统中,采用Weiner滤波增强算法提高说话人识别系统前端预处理的抗噪声能力,提高输入信号的信噪比。实验测试结果表明,该系统具有很好的抗噪声性能。  相似文献   

4.
噪声环境中基于GMM汉语说话人识别   总被引:1,自引:0,他引:1  
在噪声环境中如何提高说话人识别精度是说话人识别研究中的一个非常重要的课题.为了让说话人识别系统在安静的环境和噪声环境中都能取得满意的工作性能,研究一个将语音增强器与说话人识别器级连起来的系统.该系统中,采用Weiner滤波增强算法提高说话人识别系统前端预处理的抗噪声能力,提高输入信号的信噪比.实验测试结果表明,该系统具有很好的抗噪声性能.  相似文献   

5.
基于序贯判决法的自动说话人识别   总被引:2,自引:0,他引:2  
潘洁 《微机发展》2000,10(1):46-48
本文介绍了一种在微型计算机上实现的与文本无关的自动说话人识别系统。系统采用了一种经距离加权的矢量量化方法,提出了用于识别过程的序贯判决法,从而提高了系统识别率,并大大减少了识别系统的计算量。  相似文献   

6.
杨彦  赵力 《数据采集与处理》2015,30(6):1233-1239
为了进一步提高基于高斯混合模型的与文本无关说话人识别系统的识别性能,本文针对高斯混合模型在建模时需要较多的训练数据的缺陷,提 出了一种新的应用于小样本说话人识别系统的与文本无关说话人识别方法,该方法综合考虑了模糊集理论、矢量量化和高斯混合模型的优点,通过用模糊矢量量化误差尺度取代传统高 斯混合模型的输出概率函数,减少了建模时对训练数据量的要求,提高了模型精度和识别速 度。同时由于模糊集理论起到了“数据整形”的作用,所以增强了目标说话人数据的相似性。实验结果表明该方法针对小样本数据的说话人识别系统,识别性能优于传统的基于高斯混合模型的说话人识别系统。  相似文献   

7.
为了提高说话人识别的性能,提出一种语音特征优选方法,从目前使用效果较好的特征参数中,采用贪婪算法优选出若干维特征用于识别。在TIMIT语音数据库上实验显示,识别率相比传统方法提高了1.6%;对于加入了噪声的语音,识别率提高了6%,识别速度提高了5倍左右。实验结果表明,优选后的特征参数能够去除不良特征对识别系统的干扰,有效提高说话人识别系统的识别率和识别速度。  相似文献   

8.
为了提高说话人识别(SR)系统的运算速度,增强其鲁棒性,以现有的帧级语音特征为基础,提出了一种基于段级特征主成分分析的说话人识别算法。该算法在训练和识别阶段以段级特征代替帧级特征,然后用主成分分析方法对段级特征进行降维、去相关。实验结果表明,该算法的系统训练时间、测试时间分别为基线系统的47.8%、40.0%,同时识别率略有提高,抑制了噪声对说话人识别系统的影响。该结果验证了基于段级特征主成分分析的说话人识别算法在识别率有所提高的情况下取得了较快的识别速度,同时在不同噪声环境下的不同信噪比情况下均可以提高系统识别率。  相似文献   

9.
王娜  郑德忠  刘海龙 《控制工程》2007,14(5):495-498
干净语音环境下识别率很高的说话人识别系统,在有噪声语音环境下识别性能显著降低。针对这一问题,将小波语音增强算法应用于说话人识别系统,提出一种结点阈值去噪新方法。语音增强主要目的是从带噪语音中尽可能地提取纯净的原始语音。在不同信噪比条件下进行实验,结果表明,提出的方法比传统的阈值法能更好地提高语音质量。  相似文献   

10.
基于改进VQ算法的文本无关的说话人识别   总被引:3,自引:2,他引:3  
基于矢量量化的说话人识别,因其运算过程简单等特点,在文本无关的说话人识别领域有着广泛的应用。论文根据说话人识别中训练语音的特点并结合快速搜索算法,对矢量量化的码书形成算法进行了改进,提出了一种基于改进算法的与文本无关的说话人识别方法。经实验结果证明,论文的方法加快了码书的形成,减少了码书形成的计算量,改善了码本的性能,提高了说话人识别的识别率。  相似文献   

11.
在文本无关的说话人识别中,韵律特征由于其对信道环境噪声不敏感等特性而被应用于话者识别任务中.本文对韵律参数采用基于高斯混合模型超向量的支持向量机建模方法,并将类内协方差特征映射方法应用于模型超向量上,单系统的性能比传统方法的混合高斯-通用背景模型(Gaussian mixture model-universal background model,GMM-UBM)基线系统有了40.19%的提升.该方法与本文的基于声学倒谱参数的确认系统融合后,能使整体系统的识别性能有9.25%的提升.在NIST(National institute of standards and technology mixture)2006说话人测试数据库上,融合后的系统能够取得4.9%的等错误率.  相似文献   

12.
把频谱特征的统计参数应用于与文本无关的说活人识别系统中,与LPC参数一起作为一种更有效的参数。在与文本无关的说话人识别中,长时频谱特征的统计参数与特定人发音特征相关而与文本无关的特性弥补了LPC参数与音韵相关的不足。  相似文献   

13.
孙林慧  叶蕾  杨震 《计算机仿真》2005,22(5):231-234
测试时长是影响说话人识别问题的主要因素之一。该文主要对分布式语音识别中测试时长与说话人识别率的关系进行了研究。文中采用文本无关的训练模板,首先对基本的说话人辨认系统用干净语音和带噪语音进行了测试,结果表明系统识别率随测试时长的增加而提高,并在实验室条件下获得加噪语音最佳测试时长。其次为了减小最佳测试时长采用改进的说话人辨认系统,先对说话人的性别进行分类然后再对其身份进行识别,不仅减少了测试所需的最佳时长,而且提高了系统的抗噪性能。最后对仿真结果进行了分析。  相似文献   

14.
A text-independent speaker recognition system based on multi-resolution singular value decomposition (MSVD) is proposed. The MSVD is applied to the speaker data compression and feature extraction not at the square matrix. Our results have shown that this MSVD introduced better performance than the other Karhunen-Loeve transform with respect to the percentages of recognition.  相似文献   

15.
基于KL-小波包分析的文本无关的说话人识别   总被引:2,自引:0,他引:2  
提出了一种新的文本无关的说话人识别方法,它通过KL变换对语音进行规整、去噪,再利用小波包分解系数弹性地选择频带,提高时频分辨率,更好地提取出说话人的特征。实验证明,这种方法不仅具有较高的识别率,并且在嘈杂环境下也能保持稳定的性能。  相似文献   

16.
何亮  刘加 《计算机应用》2011,31(8):2083-2086
为了提高文本无关的说话人识别系统的性能,提出了基于线性对数似然核函数的说话人识别系统。线性对数似然核函数利用高斯混合模型对频谱特征序列进行压缩;将频谱特征序列之间的相似程度转化为高斯混合模型参数之间的距离;根据距离表达式,利用极化恒等式求得频谱特征序列向高维矢量空间的映射方法;最后,在高维矢量空间,采用支持向量机(SVM)为目标说话人建立模型。在美国国家标准技术署公布的说话人识别数据库上的实验结果表明,所提核函数具有优异的识别性能。  相似文献   

17.
针对说话人识别技术多基于语音的现状,文章提出了一种新颖的基于唇动的说话人识别技术。通过离散余弦变换,从说话人讲话时的图像序列提取那些既反映说话人嘴部生理特性也反映了说话人唇动的行为特性的视觉特征。基于这些特征,为说话人建立静态-动态混合模型,其中使用半连续隐马尔可夫模型为说话人建立动态模型。在一个小型的视觉语料库上,我们分别对说话人辨认系统和确认系统进行实现。对说话人辨认系统,其文本有关与文本无关模式的正确率分别达到了100%和99.7%;对说话人确认系统,文本有关与文本无关模式的等错误率分别为0.09%与0.33%。  相似文献   

18.
基于总体变化子空间自适应的i-vector说话人识别系统研究   总被引:2,自引:0,他引:2  
栗志意  张卫强  何亮  刘加 《自动化学报》2014,40(8):1836-1840
在说话人识别研究中,基于身份认证矢量(identity vector,i-vector) 的子空间建模被证明是目前最前沿最有效的说话人建模技术,其中如何有效准确地估计总体变化子空间矩阵T 成为影响系统性能好坏的关键问题. 本文针对i-vector 技术如何在新的应用环境下进行总体变化子空间矩阵T 的自适应估计问题进行了研究,并提出了两种行之有效的自适应估计算法. 在由美国国家标准技术局(American NationalInstitute of Standard and Technology,NIST) 组织的2008 年说话人识别核心评测数据库以及自行采集的测试数据库上的实验结果显示,不论采用测试集数据本身还是与测试集较匹配的开发集数据,通过本文所提的自适应算法来更新总体变化子空间矩阵均可以使更新后的子空间更有利于新测试数据下的低维子空间描述,在新的测试环境下都更有利于说话人分类. 此外实验结果还表明基于多子空间拼接的子空间自适应方法性能明显优于迭代自适应方法,而且两者的结合可达到最优的识别性能,且此时利用开发集数据进行自适应可以接近其利用测试集数据进行自适应得到的最优性能.  相似文献   

19.
多子系统似然度评分融合说话人识别   总被引:1,自引:0,他引:1  
李恒杰 《计算机应用》2008,28(1):116-119,119
针对短电话语音条件下文本无关说话人识别问题中语音数据不充分和电话信道失配问题,提出了一种基于话者聚类的多子系统输出似然度评分融合策略。采用KLD和GLR测度下的模型相似度聚类方法对目标话者聚类,并在每个话者类内构建由MFCC、LPCC和SSFE三个不同类型特征参数子系统组成的输出似然度评分融合系统,通过不同参数子系统的互补,即MFCC和LPCC参数的识别准确性结合SSFE的良好鲁棒性,以及不同话者类采用不同的输出似然度评分融合网络,提高了系统的整体性能。使用NIST SRE 05数据作为评估数据,实验结果表明,与传统的不分类多系统输出似然度评分融合相比,采用KLD和GLR测度的话者聚类融合策略使系统等误识率分别下降了10.3%和8.7%。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号