首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
针对双矢量量化方法中语音的静态特征和动态特征的权重不满足可加性的情况,提出了一种新的说话人识别方法——基于Sugeno测度的动态不可加双矢量量化说话人识别方法。该方法在Sugeno测度空间上将说话人语音的静态特征和动态特征用Sugeno测度进行动态融合。然后,在噪声环境下研究了该方法的识别效果,找到了噪声环境下语音的静态特征和动态特征参数的较优的权重组合。实验结果表明,与双矢量量化识别方法相比,该方法可以使识别率明显提高。该方法为研究各类语音特征参数之间的关系、探寻最优的特征匹配方案提供了一种新的途径。  相似文献   

2.
与文本无关的说话人识别方法是当前说话人识别技术的研究重点。基于矢量量化的说话人识别,因其运算过程简单等特点,在说话人识别领域有着广泛的应用。本文对矢量量化的码书形成算法进行了改进,并基于改进算法进行了与文本无关的说话人识别。经实验结果证明,本文的方法改善了码本的性能,提高了说话人识别的识别率。  相似文献   

3.
矢量量化(VQ)是一种广泛应用于说话人识别系统的算法,基于对各说话人空间矢量内的相关性的研究,结合PNDM算法,利用Matlab软件对说话人识别系统进行研究。经实验结果证明,该方法有效增加了说话人间的区分性,提高说话人识别系统的识别率。  相似文献   

4.
基于矢量量化方法的说话人识别技术   总被引:1,自引:0,他引:1  
说话人识别是一项通过语音来识别说话人身份的技术,它在保安、司法、军事、财经和信息服务等领域都具有广泛的应用前景。该文采用线性预测倒谱系数和美尔倒谱系数特征相结合,基于矢量量化聚类方法建立了一个与文本无关的、连续语音发音的说话人识别系统。只要矢量量化聚类法码本大小选择合适,该说话人识别系统就可以获得较好的识别效果。当阈值恰当选取时,该系统具备拒绝识别集外人的功能。  相似文献   

5.
本文提出一种新的矢量量化方法压缩语音特征用于孤立字语音识别.新方法借鉴了隐马尔柯夫模型(HMM)中状态的概念来规划模板;用动态规划(Dyna-mic Progamming)的技术优化矢量量化产生的初始码字.新方法使得识别所需的模板库的尺寸明显减小,识别响应时问缩短,而且由于模板的优化,使得系统的正确识别率显著提高.  相似文献   

6.
利用矢量量化的说话人识别系统的研究   总被引:2,自引:0,他引:2  
利用矢量量化(VQ)技术实现了与文本有关的说话人识别。系统采用语音信号的LPC倒谱系数、差值倒谱系数、基音周期和差值基音周期的混合特征参数作为识别的特征矢量集,对语音库中语音的平均识别率达到了92%,实时识别率达到90%以上。实验结果表明该系统具有识别精度高、速度快等特点,是一种有效的说话人自动识别的实现方法。  相似文献   

7.
矢量量化方法是与文本无关的说话人识别系统中广泛应用的建模方法之一.在矢量量化过程中,经典的LBG算法收敛速度快,但极易收敛于局部最优点,无法保证根据有限样本数据得到最优码本,并最终影响系统识别性能.本文提出了一种基于遗传算法并结合LBG算法的码本设计方法.该方法通过遗传操作获得全局优化的说话人模板,把新的识别算法应用于说话人识别的实验.结果显示,对于一个小的码本集,新的码本算法比经典的LBG算法具有更好的识别性能.  相似文献   

8.
基于多特征序贯判决的电话语音声纹鉴别方法研究   总被引:2,自引:2,他引:2  
提出一种基于倒谱特征矢量量化结合音调特征序贯判决的电话语音声纹识别方法 .文中分析了长时LPC倒谱特征和音调特征的特性 ;根据LPC倒谱各维分量对说话人识别贡献不同 ,改进了失真测度 ;用矢量量化方法建立每个说话人语音模型 ,构成一种分类准确、存储数据少、响应速度快的不依赖文本的声纹鉴别系统 ;构造一种简化的音调测度 ,将声道和声源特征结合 ,采用序贯判决策略 ,提高了系统的顽健性 .实验表明 ,在 60位说话人集合中 ,用大约 10秒的话音做识别 ,正确率达 95%以上  相似文献   

9.
一种基于正弦模型的变码率低速率宽带语音编码算法   总被引:1,自引:1,他引:0  
基于语音正弦模型,采用能量谱熵和子谐波谐波比率方法进行语音分析。根据最小二乘估计准则提取语音参数,引入多形态量化方法和幅度参数拟合量化模型,在对分裂矢量量化过程中采用动态时间归整的方法快速搜索码本,提出了一种变码率、低速率、宽带语音编码算法。仿真结果表明:在有效降低码率和算法复杂度的前提下,该算法具有语音参数分析精度高、实时性好和语音合成质量较高的特点,并能在汽车及音乐背景噪声下重建高质量语音。  相似文献   

10.
基于多特征序贯判决的电话语音声纹鉴别方法研究   总被引:1,自引:0,他引:1  
提出一种基于倒谱特征矢量量化结合音调特征序贯判决的电话语音声纹识别方法.文中分析了长时LPC倒谱特征和音调特征的特性;根据LPE倒谱各维分量对说话人识别贡献不同,改进了失真测度;用矢量量化方法建立每个说话人语音模型,构成一种分类准确、存储数据少、响应速度快的不依赖文本的声纹鉴别系统;构造一种简化的音调测度,将声道和声源特征结合,采用序贯判决策略,提高了系统的顽健性.实验表明,在60位说话人集合中,用大约10秒的话音做识别,正确率达95%以上.  相似文献   

11.
介绍了基本矢量量化器的理论和结构设计基本原理.研究和实现了基本矢量量化器的LBG算法,并着眼于在优化系统结构和性能时选择LBG算法中产生初始码书的方法.通过对输入的语音信号进行矢量量化仿真,分析了基本矢量量化器的性能.  相似文献   

12.
在MATLAB环境下实现基于矢量量化的说话人识别系统.在实时录音的情况下,利用该识别系统,对不同人的1-7 s的语音进行辨识,准确率可达到98%.识别时间根据使用人数的不同,测试语音长度的不同辨识时间从1-20 s,实现与文本无关的自动说话人确认的实时识别.  相似文献   

13.
运用多个核函数的线性组合构造多核空间,在多核空间上设计了基于支持向量机的说话人分类器,实现短语音说话人识别。多核映射能够解决单核映射核函数及其参数选择的难题,增加说话人的可区分性,提高分类器的性能。算法中结合了高斯混合模型(GMM),并以GMM超向量作为说话人的最终特征参数进行仿真实验。实验表明,在短语音和两种噪声环境中,基于多核SVM-GMM的短语音说话人识别算法较SVM-GMM算法能得到更好的识别性能和鲁棒性。  相似文献   

14.
一种小波包变换的声纹参数提取方法研究   总被引:1,自引:0,他引:1  
在声纹识别系统中,对声纹参数的提取很重要。传统的MFCC参数忽略了语音信号的动态特性,因此提出了一种基于小波包变换的声纹参数提取方法。为了更突出说话人的声纹特征,克服说话内容不同对提取声纹参数的影响,在分帧阶段采用帧长为2560点,增长有效语音段。再结合基于矢量量化(VQ)系统进行说话人识别实验,并通过比较常用的db3、db4、db6、coif3小波函数选取最优基。实验证明,相对于常用的256点帧长,帧长为2560点的识别率较高且提高了运算速率。coif3小波函数为声纹参数提取的最优基。新的WPT参数的识别率优于传统的MFCC参数。  相似文献   

15.
为克服低速率声码器因清浊音硬判决、粗判决而导致解码语音有帧过渡等不自然感的缺陷,在分析比较目前主流声码器编码算法中激励参数提取和量化算法的基础上,将模糊数学中的隶属度概念引入语音子带清浊音描述。提出了五维的浊音隶属度矢量概念,用于精细描述语音丰富的激励信息;阐述了浊音隶属度矢量的提取算法;提出了矢量量化码本的模糊聚类与LBG级联训练算法(F-LBG:Fuzzy-LBG);采用提取算法提取、建立了浊音隶属度码本的训练样本集,采用F-LBG训练了浊音隶属度码本;将提取算法和F-LBG法训练得到的浊音隶属度码本分别应用于正弦激励声码器、混合激励声码器和同态声码器的语音编、解码仿真。结果表明,用浊音隶属度矢量描述合成语音激励信号的算法,具有较高的准确性和较强的噪声鲁棒性。  相似文献   

16.
我校信息工程系胡征教授等人承担的机电部电科院预研课题“矢量量化编码技术”于1990年11月17日通过电科院组织的技术鉴定。矢量量化编码技术研究以语音编码合成为其应用背景,对矢量量化技术进行了深入研究,取得了一些创造性成果。在理论方面,提出了一种能有效提高码书成效率的训练序列  相似文献   

17.
基于矢量量化改进算法的说话人识别   总被引:2,自引:0,他引:2  
给出一种采用LPCCEP特征参数和改进矢量量化的数字音说话人识别方法 ,该方法适于说话人集合适中(10 0人以内 )情况 ,具有训练简单、存储数据量少、响应快等特点 .为提高系统的识别率和可靠性 ,系统采用了方差修正的VQ改进算法 ,使建立的说话人模型考虑了说话人帧特征概率分布的更精细结构 .实验结果表明 ,改进后的方法对提高系统的识别率效果明显  相似文献   

18.
在矢量量化孤立字识别系统中,对于识别字典中每一个单字,都要分别建立与这些单字对应的码本。本文提出一种按音节递归训练码本的算法,它的计算量是训练语音帧数的线性函数。而传统的LBG聚类算法的运算量则随训练矢量增加呈指数率增长。本文比较了这两种算法的失真特性,得出结论:新方法需要n+1次发音训练,就能达到全搜寻算法n次发音训练的失真性能。最后,本文给出矢量量化孤立字识别器的实验结果。  相似文献   

19.
给出一种采用LPCCEP特征参数和改进矢量量化的数字音说话人识别方法,该方法适于说话人集合适中(100人以内)情况,具有训练简单、存储数据量少、响应快等特点.为提高系统的识别率和可靠性,系统采用了方差修正的VQ改进算法,使建立的说话人模型考虑了说话人帧特征概率分布的更精细结构.实验结果表明,改进后的方法对提高系统的识别率效果明显。  相似文献   

20.
汉语语音转换技术的目的是在保持语义信息不变的前提下将汉语语音中源说话人的语音特征转换为目标说话人的语音特征.提出的适用于汉语说话人高自然度语音转换算法主要分为三个部分:前两部分用VQ模型实现了语音的谱包络及其激励的转换,第三部分采用BP算法实现语音的韵律转换规则建模.算法针对汉语语音超音段发音特点进行韵律调整,有效实现了汉语语音转换并得到高自然度合成语音.实验表明本文提出的转换方法是一种有效的汉语语音转换算法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号