首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 109 毫秒
1.
给出一种采用LPCCEP特征参数和改进矢量量化的数字音说话人识别方法,该方法适于说话人集合适中(100人以内)情况,具有训练简单、存储数据量少、响应快等特点.为提高系统的识别率和可靠性,系统采用了方差修正的VQ改进算法,使建立的说话人模型考虑了说话人帧特征概率分布的更精细结构.实验结果表明,改进后的方法对提高系统的识别率效果明显。  相似文献   

2.
矢量化(VQ)是一种及其重要的信号压缩方法,广泛应用于语音信号压缩等领域。说话人识别系统利用所建的VQ码本保存了说话人一定的声道特性,来进行说话人识别,完成这个识别系统有两个步骤:一是建立参考模型码本;二是进行模式匹配。  相似文献   

3.
基于矢量量化方法的说话人识别技术   总被引:1,自引:0,他引:1  
说话人识别是一项通过语音来识别说话人身份的技术,它在保安、司法、军事、财经和信息服务等领域都具有广泛的应用前景。该文采用线性预测倒谱系数和美尔倒谱系数特征相结合,基于矢量量化聚类方法建立了一个与文本无关的、连续语音发音的说话人识别系统。只要矢量量化聚类法码本大小选择合适,该说话人识别系统就可以获得较好的识别效果。当阈值恰当选取时,该系统具备拒绝识别集外人的功能。  相似文献   

4.
利用矢量量化的说话人识别系统的研究   总被引:2,自引:0,他引:2  
利用矢量量化(VQ)技术实现了与文本有关的说话人识别。系统采用语音信号的LPC倒谱系数、差值倒谱系数、基音周期和差值基音周期的混合特征参数作为识别的特征矢量集,对语音库中语音的平均识别率达到了92%,实时识别率达到90%以上。实验结果表明该系统具有识别精度高、速度快等特点,是一种有效的说话人自动识别的实现方法。  相似文献   

5.
在MATLAB环境下实现基于矢量量化的说话人识别系统.在实时录音的情况下,利用该识别系统,对不同人的1-7 s的语音进行辨识,准确率可达到98%.识别时间根据使用人数的不同,测试语音长度的不同辨识时间从1-20 s,实现与文本无关的自动说话人确认的实时识别.  相似文献   

6.
针对双矢量量化方法中语音的静态特征和动态特征的权重不满足可加性的情况,提出了一种新的说话人识别方法——基于Sugeno测度的动态不可加双矢量量化说话人识别方法。该方法在Sugeno测度空间上将说话人语音的静态特征和动态特征用Sugeno测度进行动态融合。然后,在噪声环境下研究了该方法的识别效果,找到了噪声环境下语音的静态特征和动态特征参数的较优的权重组合。实验结果表明,与双矢量量化识别方法相比,该方法可以使识别率明显提高。该方法为研究各类语音特征参数之间的关系、探寻最优的特征匹配方案提供了一种新的途径。  相似文献   

7.
应用聚类有效性分析来生成可变电码本,实验数据表明,此算法能够根据每个说话人的语音特征自动生成大小合适的电码本,并且能够保持性能的条件下有效减小电码本的大小。  相似文献   

8.
9.
语音识别和控制环境中,非语音信号(噪音)很容易与语音信号相混淆,一部分噪音被机器误认为语音,导致系统性能恶化.针对这一问题,以说话人识别理论为基础,提出了一种采用矢量量化来对音频信号类型(噪音或语音)进行确认的方法,以便于后期对非语音信号的噪音进行鉴别并且予以消除,提高语音信号处理系统的工作效率.在此基础之上,在MATLAB平台上设计了一个基于此方法的语音与非语音识别的仿真系统.测试结果表明,系统实现了语音与非语音识别的基本功能,达到较好的工作效果.  相似文献   

10.
基于VQ-SVM的说话人识别系统   总被引:1,自引:0,他引:1  
说话人识别系统通常是将在安静的环境下训练得到的参数应用于实际环境中。如果实际环境也是安静的,则说话人识别系统可以令人满意地工作。然而,当实际环境中有噪声存在时,说话人识别系统性能急剧下降。为了让说话人识别系统在安静的环境和有噪声的环境中都获得令人满意的工作性能,研究了一个将支持向量机(SVM)在矢量量化(VQ)系统上进行二次识别来提高说话人识别率的方法。通过引入阈值自适应,从而提高系统性能。实验表明,在噪声环境下,与VQ,SVM识别方法相比,此方法在对识别速度影响很小的情况下可以使识别率明显提高。此方法具有良好的应用前景和进一步研究的价值。  相似文献   

11.
基于多特征序贯判决的电话语音声纹鉴别方法研究   总被引:2,自引:2,他引:2  
提出一种基于倒谱特征矢量量化结合音调特征序贯判决的电话语音声纹识别方法 .文中分析了长时LPC倒谱特征和音调特征的特性 ;根据LPC倒谱各维分量对说话人识别贡献不同 ,改进了失真测度 ;用矢量量化方法建立每个说话人语音模型 ,构成一种分类准确、存储数据少、响应速度快的不依赖文本的声纹鉴别系统 ;构造一种简化的音调测度 ,将声道和声源特征结合 ,采用序贯判决策略 ,提高了系统的顽健性 .实验表明 ,在 60位说话人集合中 ,用大约 10秒的话音做识别 ,正确率达 95%以上  相似文献   

12.
介绍了一种基于VQ的小词汇量特定人快速语音识别方法,并对该方法中的关键参数进行了比较性研究. 这一方法尤其适用于汉语特定人小词汇量语音识别. 与典型的HMM和NN识别算法相比,该方法复杂度低、系统资源消耗少而识别率高,在对汉语11个数字的大规模识别测试中误识率仅为3.86%. 因此,该方法适合于在手机、PDA等资源有限的系统中实现语音数字拨号、人名拨号及查询等语音控制功能.  相似文献   

13.
本文讨论了图像格矢量量化过程中如何标记格矢量的问题,在理论上详细地叙述了格的定义以及2维六角格A2,4维棋盘格D4,8维Gosset格E8与16维Barnes-Wall格Λ16的标记算法,并结合小波变换,给出了图像格矢量的标记方法.  相似文献   

14.
基于特征选择的高光谱图像快速矢量量化算法   总被引:1,自引:0,他引:1  
高光谱图像在取得较高光谱分辨率的同时带来了海量数据,使其压缩成为必需.矢量量化技术在高光谱图像压缩中取得了良好效果,但有计算复杂度高的缺点.针对高光谱图像谱带间高度冗余的情况,本文提出基于特征选择的快速矢量量化算法.该算法在减少运算量同时,能取得和LBG算法相近的压缩效果.实验表明在信噪比略微下降的情况下,计算时间下降了94.32%.  相似文献   

15.
声纹识别系统   总被引:3,自引:0,他引:3  
介绍一个与本无关、与语种无关、与性别无关的声纹识别系统,采用的技术包括MFCC特征提取、VQ矢量量化、LBG聚类建模、数据有效性距离测度和计算机深度编程等,在字表大小为50人以内时识别率接近100%。  相似文献   

16.
提出了DCT域结合VQ的图象信息压缩方案。有两个特点:1.基于图象信号的非平稳性等特点,分块DCT后,根据变换域系数的能量分布进行信源分类产生自适应方案,2.分类后的信源进行一个我们称之为“子块重排”的变换域操作,从而得到很好的VQ结果。实验表明本文方案在利用图象信源的非平稳性,提高矢量量化器效率,简化矢量量化器设计,以及系统实现的便利性诸方面具有较大的优越性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号