首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 156 毫秒
1.
基于方差归一化失真测度的改进的LBG算法   总被引:3,自引:1,他引:2  
矢量量化(VQ)技术在话者识别系统中得到了广泛的应用。 VQ码本的产生通常采用 LBG算法,失真测度则为对矢量的各分量等权重的欧氏距离。在话者识别系统中特征矢量的各个分量的分布是有差别的,且对于不同的话者,这种差别的程度又是不一样的。由于不同分布的各维参数对话者识别的有效性各不相同,因此,文章提出了一种能反映这种有效性差别的失真测度,即:方差归一化失真测度。以该失真测度为基础,并结合时序相关的初始码本设计方法及有效的零胞腔处理技术,文章提出了改进的LBG算法,同时利用该算法训练出改进的VQ话者模型,并进行了话者识别实验。  相似文献   

2.
本文提出了一种基于子带技术和人工神经网络技术的鲁棒性的话者确认阈值的设计方法.将语音信号的有效频段划分为几个子带独立地训练或识别,并在对各个子带的输出数据融合的基础上作最后的判决.各个子带的模型训练及识别采用矢量量化技术,数据的融合技术则采用BP型人工神经网络.采用子带技术可以提高话者确认阈值的时间鲁棒性,采用神经网络技术一方面是为了对各子带的输出进行非线性数据融合,另一方面则是为了能够对话者本人的数据和冒认者的数据进行混合训练,以使训练出的确认阈值对冒认者的不确定性具有鲁棒性.本文提出的设计方法可得到鲁棒性的确认阈值,并得到了实验验证.  相似文献   

3.
传统的利用话者的一个时期的语音作为训练语音,进行话者码本训练的方法,识别系统往往不够稳定.为了适应话者自身语音的时变性,文中提出了利用话者不同时期的语音进行训练话者的模型,每个话者具有多个码本.这些码本是采用逐渐减小误识率的优化过程得到的.为了补偿不同信道对系统识别性能的影响,文中给出了一种信道补偿方法.同时提出以一帧高能的浊音语音特征代替一个浊音音素的特征,实现了在线浊音特征提取,利用两级矢量量化及码本索引策略减少了44%的识别计算量.这些方法大大增加了系统的识别速度和鲁棒性.文中比较了用PLP分析和LPC倒谱分析进行话者辨认的识别结果.  相似文献   

4.
基于模糊矢量量化图象编码的研究   总被引:4,自引:0,他引:4       下载免费PDF全文
分析了模糊矢量量化(FVQ)图象编码的原理,给出了FVQ设计三要素。提出了用于图象编码的指数型模糊矢量量化算法(FVQE)。实验结果表明,FVQE的图象编码性能与FVQ相当,但收敛速度要略快于FVQ算法。  相似文献   

5.
本文讨论了用矢量量化/隐马尔可夫模型(VQ/HMM)法实现的语音识别系统,重点阐述了如何利用HMM对多训练序列的迭代公式使系统具有自学习功能。经实测证明,该系统基本达到了预期性能。  相似文献   

6.
传统的利用话者的一个时期的语音作为训练语音,进行语者码本训练的方法,识别系统往往不够稳定。为了适应话者自身语音的时变性,文中提出了利用话者不同时期的语音进行训练话者的模型,每个语者具有多个码本。这些码本是采用逐渐减小误识率的优化过程得到的。为了补偿不同信道对系统识别性能的影响,文中给出了一种信道补偿方法。  相似文献   

7.
将反向迭代法引入对VQ(矢量量化)编码误差进行修正,从而使建立在小波变换基础上的VQ编码方法的重建图象质量得到改善,使信噪比(SNR)提高了3~8dB。对于与训练集内样本相差较大的图象在压缩比相同的条件下,改善重建图象的效果尤为明显。  相似文献   

8.
本文对神经网络语音识别中的语音特征提取、网络结构以及学习算法进行了初步的研究,提出了一种用于时特征矢量量化的简化和改进的自组织神经网络模型VQNN。VQNN中引入了动态规划法估计语音样本矢量的码本类中心初值并确定网络的初始权矩阵,可构造出256个量化等级的码本矢量。该方法具有较强的鲁棒性且矢量量化过程简单迅速。对28个地名的语音量化识别实验结果表明了这种量化方法对时识别的有性。  相似文献   

9.
改进径向基函数神经网及其在手写体字符识别中的应用   总被引:3,自引:0,他引:3  
提出一种基于半模型矢量量化(SFVQ)技术的改进径向基函数神经网(IRBFNN)分类器,并且用于无约束手写体数字的识别。作者在模糊聚类和矢量量化的基础上利用半模糊的思想提出了半模糊矢量量化算法,并在其中加入了有监督的控制,从而使系统在聚类过程中可以确定比较合适的类别数并使聚类结果能更好地反映训练集的概率分布。以半模糊矢量量化作为预处理的改进RBF网,应用了多尺度补偿等办法,能够充分利用训练样本集的  相似文献   

10.
基于自组织特征映射神经网络的矢量量化   总被引:7,自引:0,他引:7       下载免费PDF全文
近年来,许多学者已经成功地将Kohonen的自组织特征映射(SOFM)神经网络应用于矢量量化(VQ)图象压缩编码,相对于传统的KLBG算法,基于的SOFM算法的两个主要缺点是计算量大和生成的码书性能较差因此为了改善码书性能,对基本的SOFM算法的权值调整方法作了一些改进,同时为了降低计算量,又在决定获得胜神经元的过程中,采用快速搜索算法,在将改进的算法用于矢量量化码书设计后,并把生成的码书用于图象  相似文献   

11.
An important task of speaker verification is to generate speaker specific models and match an input speaker’s utterance with these models. This paper focuses on comparing the performance of text dependent speaker verification system using Mel Frequency Cepstral Coefficients feature and different Vector Quantization (VQ) based speaker modelling techniques to generate the speaker specific models. Speaker-specific information is mainly represented by spectral features and using these features we have developed the model which serves as an important entity for determining the claimed identity of the speaker. In the modelling part, we used Linde, Buzo, Gray (LBG) VQ, proposed adaptive LBG VQ and Fuzzy C Means (FCM) VQ for generating speaker specific model. The experimental results that are performed on microphonic database shows that accuracy significantly depends on the size of the codebook in all VQ techniques, and on FCM VQ accuracy also depend on the value of learning parameter of the objective function. Experiment results shows that how the accuracy of speaker verification system is depend on different representations of the codebook, different size of codebook in VQ modelling techniques and learning parameter in FCM VQ.  相似文献   

12.
一种基于VQ的说话人确认的阈值的设计方法   总被引:1,自引:0,他引:1  
基于矢量量化的说话人确认系统的阈值的选取是影响系统性能的重要因素之一,而传统的采用固定的经验值作为阈值的方法鲁棒性差,且需要进行大量的实验。本文提出了用训练语音得到的码本以及平均失真作为表征说话人的模型,并基于此模型对说话人确认系统中阈值的确定提出了一种新的解决方法,实验结果表明由该方法得出的阈值比传统的经验值具有更好的鲁棒性,系统的识别率也有了显著的改善。  相似文献   

13.
矢量量化与神经网络相结合的说话人识别系统   总被引:2,自引:0,他引:2  
李战明  王贞 《计算机工程与应用》2006,42(15):204-206,230
介绍了说话人识别系统的基本概念,在分析了传统VQ模型与神经网络模型的基础上,提出了一种VQ与神经网络相结合的说话人识别系统模型。通过提取出的特征参数(MFFC),建立系统模型,实验证明了该模型性能随着时间的变化有较好的稳定性。  相似文献   

14.
屈微  刘贺平 《计算机应用》2005,25(10):2401-2403
使用独立分量分析(ICA)来提取说话人特征并与矢量量化(VQ)判决方法相结合,实现了一个高性能的基于ICA特征的VQ (ICA VQ)说话人识别系统。通过ICA变换得到说话人语音特征基函数系数用于生成VQ码书,并导出包含能量失真的ICA VQ码书失真测度和质心确定条件,生成最终的判决。仿真实验中ICA提取的特征分别用于不同系统实现说话人确认任务,各系统的DET曲线对比验证了VQ方法用于ICA特征分类判决的优势,同时不同码书尺寸下的等差率(EER)对比证明了VQ码书设计的有效性。  相似文献   

15.
该文介绍了一种基于矢量量化(VQ)方法的一个说话人识别算法。基于矢量量化的说话人识别,因其运算过程简单等特点,在说话人识别领域有着广泛的应用。用不同语音参数进行实验,实验表明应用矢量量化的方法用在说话人识别中是一种有效方法。  相似文献   

16.
基于改进VQ算法的文本无关的说话人识别   总被引:3,自引:2,他引:3  
基于矢量量化的说话人识别,因其运算过程简单等特点,在文本无关的说话人识别领域有着广泛的应用。论文根据说话人识别中训练语音的特点并结合快速搜索算法,对矢量量化的码书形成算法进行了改进,提出了一种基于改进算法的与文本无关的说话人识别方法。经实验结果证明,论文的方法加快了码书的形成,减少了码书形成的计算量,改善了码本的性能,提高了说话人识别的识别率。  相似文献   

17.
讨论基于GMM-UBM/SVM的电话语音监控系统。GMM是说话人识别系统中使用的常用方式。但由于监控语音发话时间短暂,电话-互联网终端及传输线背景噪音大等因素影响了GMM的识别精度。基于GMM的鲁棒性及SVM对小量静态数据具有高分类的优势设计电话语音监控系统并通过维吾尔语研讨了系统性能。为了便于比较,同时也讨论了量化距离(VQ)、加权量化距离(WVQ)及基线系统的识别。在50个目标人训练集,每人发话时间为20秒时,对10秒测试语音提案方法识别率对比于VQ和WVQ法分别提高了20.2%及16.7%。  相似文献   

18.
基于话者特征图案的BPNN话者模型   总被引:1,自引:0,他引:1  
该文提出了一种用于说话人识别的基于话者特征图案的BPNN话者模型,该话者模型解决了语音信号的时长变化与神经网络输入层结点数固定不变之间的矛盾。利用VQ技术对所有话者的语音样本训练出话者特征图案,再将语音样本对该特征图案进行映射,在映射域解决了语音样本的时间规正问题。同时,该方法还提高了映射域参数的模式分类能力。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号