首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 171 毫秒
1.
在基于高斯混合模型(GMM)的声纹识别算法中,K-means聚类算法是GMM模型参数初始化常用的方法之一。传统K-means算法在聚类过程中采用几何距离进行分类,忽略了类中各矢量的分布不同对聚类结果的影响,常常得不到令人满意的识别结果。文中对传统K-means算法进行了改进,并将改进后的K-means算法与GMM结合应用到声纹识别系统中。实验结果表明,改进的K-means算法与传统的算法相比具有更好的识别效果。  相似文献   

2.
在LABVIEW平台上,通过声卡获得语音信号,设计了以美尔频率倒谱系数及其差分作为语音识别的特征参数,通过动态时间规整算法来识别的与文本有关的说话人辨认系统.  相似文献   

3.
声纹识别是一种能根据待识别语音的声纹特征识别说话人的技术. 本文阐述了声纹识别系统的原理知识,介绍了声纹识别系统的体系架构,本系统采取分层结构,核心业务分解为业务层和实现层,多个层的多个功能模块被设计成独立的服务,从而提升了声纹识别系统的识别准确率,最后给出了系统在实际生产环境下的产品设计方案.  相似文献   

4.
与文本无关的说话人识别方法是当前说话人识别技术的研究重点。基于矢量量化的说话人识别,因其运算过程简单等特点,在说话人识别领域有着广泛的应用。本文对矢量量化的码书形成算法进行了改进,并基于改进算法进行了与文本无关的说话人识别。经实验结果证明,本文的方法改善了码本的性能,提高了说话人识别的识别率。  相似文献   

5.
矢量量化方法是与文本无关的说话人识别系统中广泛应用的建模方法之一.在矢量量化过程中,经典的LBG算法收敛速度快,但极易收敛于局部最优点,无法保证根据有限样本数据得到最优码本,并最终影响系统识别性能.本文提出了一种基于遗传算法并结合LBG算法的码本设计方法.该方法通过遗传操作获得全局优化的说话人模板,把新的识别算法应用于说话人识别的实验.结果显示,对于一个小的码本集,新的码本算法比经典的LBG算法具有更好的识别性能.  相似文献   

6.
针对现实应用场景中短时语音和混叠有噪声情况下声纹识别准确性低的问题,本文设计了一种改进的基于深度学习的声纹识别算法,提高了声纹识别模型在短时语音和带噪环境下的鲁棒性,并将该模型部署到了嵌入式设备中.本文主要对声纹识别算法的编码层和损失函数进行改进.对于编码层,本文使用了基于差分编码的NeXtVLAD技术,同时对帧级特征中的静态声纹特征和动态声纹特征进行建模.对于损失函数,本文将基于小样本学习框架的余弦-原型损失函数cosine-Prototypical与附加间隔分类损失函数AM-Softmax进行融合来训练声纹识别模型,使得模型在特征空间中的同类特征尽可能集聚,异类特征尽可能分离.此外,本文还将声纹识别算法部署在Raspberry Pi平台上,实现了能快速推理的声纹识别系统.实验结果表明:这种改进的声纹识别系统在多种开放场景下,能够实时、准确地完成声纹识别任务,可以达到实际应用的要求.  相似文献   

7.
针对战场声目标识别目前广泛采用的单一分析域特征提取算法会使部分重要信息遗漏,识别率低的问题,分析战场声信号的产生机理,得出声信号中既含随机性的机械噪声,又含准周期性的空气动力噪声;基于此,提出一种小波包与离散谱分析相结合的多特征参数提取算法。该算法利用小波包变换提取非均匀频段的能量分布特征,将其与离散谱描述的时域准周期性特征组合,得到更全面反映目标信号特性的特征参数。实验结果表明,相比单一分析域特征提取算法,多特征提取算法应用于声识别的准确性和鲁棒性明显提高。  相似文献   

8.
针对非接触式电力变压器在监测及运行状态识别过程中存在的问题,提出了一种基于粒子群优化的电力变压器声纹识别技术。通过利用加权优化的线性预测倒谱系数和差分组合的梅尔频率倒谱系数作为变压器声纹识别的特征向量,构建了应用于变压器声纹识别的粒子群优化神经网络模型。实验结果表明,特征向量为线性倒谱系数时,所提模型识别效率要比BP神经网络的识别效率高33%;采用梅尔倒谱系数作为特征量识别准确率比线性预测倒谱系数大约提高了5.3%,平均识别时间缩短了约25%。  相似文献   

9.
一种改进的LBG算法在声纹识别中的应用   总被引:1,自引:0,他引:1  
提出一种改进的矢量量化VQ(Vector Quantization)算法,优化了现有的声纹识别技术,并已经得到了应用。对基于LBG(Linde Buzo Gray)算法中现有的倒谱参数MFCC(Mel-Frequency Ceptral Coefficients)在声纹识别中的提取以及声纹模型建立的相关改进,使得矢量量化局部最优的特点在新的声纹模型建立时得到更好的应用。在保证识别率的情况下减少了匹配次数,降低了运行时间。经过测试,语音的平均识别率达到了92%以上,实时识别率达到90%以上。实验结果表明,相对于LBG算法原型,改进的算法的识别精度和速度都有所提高,是一种有效的声纹自动识别的实现方法。  相似文献   

10.
基于CRFs的多策略生物医学命名实体识别   总被引:1,自引:0,他引:1  
生物医学命名实体识别是生物医学文本挖掘的基本任务。机器学习方法是生物医学命名实体研究的主流方法,选取有效的机器学习算法和采取有效的识别策略是提高生物医学命名实体识别性能的关键,鉴于条件随机域算法在自然语言处理领域的优势,本文采用该算法并结合多种识别策略对生物医学命名实体识别进行研究。实验取得了良好的效果,F测度达到了70.52%,与其它相关系统比较,识别性能有了明显提高。  相似文献   

11.
论述了声纹识别技术的基本原理,采用DSP及其他可编程芯片设计出声纹识别系统的硬件部分,阐述了其结构及工作原理。基于隐马尔可夫模型为算法,以线性预测倒谱系数和Mel频域倒谱系数为特征矢量进行了系统仿真。结果表明,在结合使用两种倒谱系数及差分时,系统具有较高的识别率。  相似文献   

12.
提出一种新型声纹识别系统的设计方案.有别于传统声纹识别系统的是,该识别系统的预处理部分使用言语过滤的方法,特征提取过程采用情感补偿的办法.其中,言语过滤以语音识别为技术支持,可以剔除嘈杂背景,限制冒名顶替,排除语音赝本等等;情感补偿以语音情感计算为理论基础,能够很好地解决声音漂移、伪装模仿等同题.基于这两部分提取特征数据将更加准确有效.  相似文献   

13.
在基于GMM的说话人确认系统中,模型的训练是为每个说话人的语音建立模型,然后通过一定的算法找到一组参数λ,使似然概率最大。文中通过对GMM的研究提出一种改进的模糊C均值算法(FCM)并将改进后的算法应用到模型初始化中。同时,GMM在话者确认时,语音数据不足会导致识别率下降,本文采用能覆盖话者语音的高斯混合模型.通用背景模型(GMM-UBM)作为识别模型,通过算法比较及实验分析可知,改进算法后的系统在识别率上明显优于传统的基于GMM的说话人识别系统。  相似文献   

14.
对风力发电机组叶片异常检测进行研究,发现依靠单台风力发电机3个叶片声纹之间的参考和对比即可诊断该台风力发电机叶片是否故障。为此,该文提出基于聚类和中值收敛的周期性音频切割方法,对声纹进行有效的切割,减少了计算量,为后续异常检测提供了基础。采用风力发电机组3个叶片之间的稳态差异法对异常进行检测,绕开了待检物,信道等变化所带来的算法迁移失效问题,具有良好的泛化性。为风力发电机组叶片检测提供了一种有效的技术手段。  相似文献   

15.
在说话人识别系统中,语音特征参选是系统的关键问题之一.本文研究了MFCC参数、小波包分析.从听觉特性出发,提出基于小波包分析代替傅立叶变换的一种新的特征参数,给出了衡量各种特征参数识别能力的Fisher准则,结合Fisher准则构造一种新的混合特征参数,最后采用支持向量机实现说话人的分类识别.实验数据表明:有效地提高了说话人辨认系统的识别率.  相似文献   

16.
针对语音识别过程中环境噪声干扰大的问题,提出一种基于经验模态分解(EMD)与动态时间规整 (DTW)相结合的孤立词识别算法。该方法利用EMD 算法,首先将提取的性能不好的语音信号分解成若干个基本模函数(IMF),去掉原始信号中的干扰和噪声。然后,基于DTW 算法,采用短时过零率和短时能量对语音信号进行端点检测,提取语音特征参数后与参考模板进行匹配。将参考模板与待测模板之间的最短路径作为识别结果。仿真结果表明,该算法能够提高语音的识别效率和识别的正确率。  相似文献   

17.
语音情感识别是从语音的角度赋予计算机理解情感特征的能力,最终使计算机能像人一样进行自然、亲切和生动的交互。提出了一种融合隐马尔科夫模型(hidden markov model,HMM)和概率神经网络(probabilistic neural network,PNN)的语音情感识别方法。在所设计情感识别系统中,提取出基本的韵律参数和频谱参数,利用PNN处理声学参数的统计特征,利用HMM处理声学参数的时序特征,运用加法规则和乘法规则融合了统计特征和时序特征的识别结果。实验结果显示,所提出的算法在语音情感识别中具有有效的识别能力。  相似文献   

18.
运用多个核函数的线性组合构造多核空间,在多核空间上设计了基于支持向量机的说话人分类器,实现短语音说话人识别。多核映射能够解决单核映射核函数及其参数选择的难题,增加说话人的可区分性,提高分类器的性能。算法中结合了高斯混合模型(GMM),并以GMM超向量作为说话人的最终特征参数进行仿真实验。实验表明,在短语音和两种噪声环境中,基于多核SVM-GMM的短语音说话人识别算法较SVM-GMM算法能得到更好的识别性能和鲁棒性。  相似文献   

19.
针对鸣笛抓拍系统会产生误判的问题,提出了一种基于子带谱熵法和支持向量机的汽车鸣笛识别算法. 首先,使用子带谱熵法对声音样本进行初判,将子带谱熵高于阈值的样本直接判定为非鸣笛样本. 然后,对初判为鸣笛的样本中的疑似鸣笛部分进行分割,并提取Mel频率倒谱系数作为声音的特征. 最后,使用支持向量机对分割结果进行进一步分类,并使用粒子群算法与遗传算法的融合来优化支持向量机的参数. 仿真结果表明,该算法具有较好的鲁棒性. 在对实际采集样本的鸣笛识别中,该算法也取得了较高的准确率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号