首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
基于ARM的说话人识别系统的研究与实现   总被引:1,自引:0,他引:1       下载免费PDF全文
提出了一种基于压缩感知(CS)的说话人识别算法以及在ARM系统中的实现,首先,介绍压缩感知理论框架,提出说话人识别可以与压缩感知理论相结合的依据;其次,提出基于压缩感知的说话人识别算法的基本方法,即建立说话人语音特征数据库和基追踪匹配得到最大均值系数,其中,语音特征向量由GMM均值超向量核算法得到,大量实验数据表明,该方法一定程度上提高了识别率,并且在说话人集合较大的情况下识别效果较好。  相似文献   

2.
基于I-Vector的说话人识别系统通常采用LDA进行信道补偿和特征降维,在开发集样本有限的情况下,LDA的区分性不强.基于此,提出一种改进I-Vector说话人确认算法.在话者样本数较少的情况下,以中值i向量代替均值i向量作为集中统计量可以减少区分信息的丢失.随着样本数量增加,改进中值分类器,采用去最大最小值后求均值的方法作为i向量的集中趋势.用此方法计算类间与类内离散度矩阵后,对i向量进行信道补偿和降维.结合高斯PLDA模型,以LDA和WCCN为基线系统进行仿真对比.实验结果表明,提出的算法具有良好的区分性能,在有限的话者语音样本数量范围内,与基线相比能提升总和约3%的性能.  相似文献   

3.
时分复用(TDD)系统通过信道互异性可以在发送端得到下行信道矩阵。由于上下行信道存在着处理延时,时变信道下,延时带来的信道误差会降低多用户MIMO预编码的系统性能。信道预测在某些情况下能够较好地改善信道误差,但预测误差又会给系统性能带来损失。该文针对预测误差带来的性能损失,提出了一种基于预测误差改进的预编码算法。改进算法根据预测误差的方差对预编码向量进行修正,能够进一步提高系统误码率性能。仿真结果表明,在高车速情况下,该算法比传统的预测预编码算法能带来更大的性能增益。  相似文献   

4.
介绍说话人识别技术发展情况,阐述包括特征提取、识别算法和区分算法在内的文本无关说话人识别系统的整体技术框架和基本工作原理针对文本无关说话人识别相关技术给出了近几年主要发展的高斯超向量—支持向量机模型(GSV-SVM)、联合因子分析模型(JFA)和鉴别性向量(i-vector)模型,并对3种模型进行了分析比较:指出GSV-SVM模型可以提高识别系统性能;JFA模型能提高系统性能但计算量过大,难以实现应用;i-vector模型降低了计算量,并能提高识别精确度和效率,是目前的研究热点。最后指出当前文本无关说话人识别的研究难点和热点。  相似文献   

5.
李聪  葛洪伟 《信号处理》2018,34(7):867-875
由于环境噪声的影响,实际应用中说话人识别系统性能会出现急剧下降。提出了一种基于高斯混合模型-通用背景模型和自适应并行模型组合的鲁棒性语音身份识别方法。自适应并行模型组合是一种噪声鲁棒性的特征补偿算法,能够有效减少训练环境与测试环境之间的不匹配现象,从而提高系统识别准确率和抗噪性能。首先,算法从测试语音中估计出噪声特征,然后用一个单高斯模型对噪声特征进行拟合得到噪声均值和协方差。最后,根据得出的噪声均值和协方差,调整训练好的高斯混合模型均值向量和协方差矩阵,使其尽可能地匹配测试环境。实验结果表明,该方法可以准确地重构干净语音的高斯混合模型参数,并且能够显著提高说话人识别的准确率,特别是在低信噪比情况下。   相似文献   

6.
 在文本无关的说话人确认中,规整算法能够有效地调整测试得分的分布.另外,利用前面已经得到的测试语句的得分来调整规整的参数可以取得更好的效果,这种规整叫做非监督得分规整.在本文中,借用开发集得分来建立说话人和冒认者得分的两个先验高斯分布函数,在实际的测试中,利用最大后验概率准则来对规整的模型参数进行调整.在采用因子分析的情况下,在NIST 2006说话人识别测试1conv4w-1conv4w数据库上,能够取得等错误率5.26%.  相似文献   

7.
张涛涛  陈丽萍  戴礼荣 《信号处理》2016,32(10):1213-1219
在说话人确认中,特征端因子分析(Acoustic Factor Analysis, AFA)利用MPPCA(Mixtures of Probabilistic Principal Component Analyzers, MPPCA)算法在通用背景模型(Universal Background Model, UBM)的每个高斯上分别对特征降维以去除语音特征中文本、信道和噪声等信息的干扰,获得增强的说话人信息并用于提升说话人确认的性能。但是通用背景模型属于无监督的聚类方法,其每个高斯成分物理意义不够明确,不能区分不同说话人发不同音素时的情况。为解决这一问题,本文利用语音识别中的声学模型深度神经网络(Deep Neural Network, DNN)取代传统的通用背景模型并结合特征端因子分析分别对不同音素上的语音特征进行降维提取出说话人信息,进而提取DNN i-vector用于说话人确认。在RSR2015数据库PartIII上的实验结果表明该方法相对于基于UBM的特征端因子分析方法在男女测试集上等错误率(Equal Error Rate, EER)分别下降13.49%和22.43%.   相似文献   

8.
随着说话人识别技术的发展,实用有效的说话人识别系统越来越成为研究的重点.语音特征参数的鲁棒性直接影响一个说话人识别系统的具体性能,过去主要针对移动通信环境下存在信道失真的问题,研究差分倒谱的鲁棒性.文中则主要在加性白噪声环境下研究Mel倒谱参数、Mel差分倒谱参数的顽健性以及它们经过倒谱系数零均值化(CMN)处理后识别性能的改进.从仿真结果可以看出:在加性白噪声环境下,差分倒谱参数具有很好的鲁棒性;倒谱系数零均值化能有效的除去加性白噪声.  相似文献   

9.
王华朋  杨军  吴鸣  许勇 《电声技术》2013,37(4):61-67,71
在新的似然比法庭证据评估体系下,为降低对问题语音和嫌疑人语音样本数量的要求,提出了改进的基于GMM-UBM识别核心的法庭自动说话人识别系统。为降低信道差异对法庭自动说话人识别系统性能的影响,提出了一种不同信道间说话人模型补偿与Logistic回归混合处理的方法。固定电话信道和移动电话信道的实验结果表明:改进的自动识别系统在非匹配信道中使用4秒的测试语音,与未使用模型补偿的系统相比,错误认定率从28.95%下降为6.32%,大幅度提高了系统在非匹配条件下的可靠性。  相似文献   

10.
张玲华  杨震  郑宝玉 《通信学报》2005,26(11):68-75
提出了基于模糊超椭球聚类算法的说话人辨认新方法。该算法首先将某一类的训练数据分成若干子类, 对每一子类在其中心周围定义具有超椭球区域的模糊规则。实验表明,该系统可以较快的聚类速度取得与HMM 相当的识别效果。进一步的研究表明,基于模糊超椭球聚类算法的说话人辨认系统与传统的基于HMM的识别方法存在一个共同的缺点,即抗噪性能较差。为此,通过引入多层前馈神经网络(MLFNN)与模糊超椭球分类器构成混合模型,使系统的识别性能和抗噪能力显著提高。  相似文献   

11.
黄伟  戴蓓蒨  李辉 《电子与信息学报》2004,26(10):1607-1612
该文提出了一种基于分类高斯混合模型和神经网络融合(FS-GMM/NN)的说话人识别方法,通过对特征矢量进行聚类分析,将说话人的训练语音分成若干类。然后根据各个类中含特征矢量的多少采用不同的模型混合度,训练建立分类高斯混合模型。并采用神经网络实现各个分类高斯混合模型输出的融合。在100个男性话者的与文本无关的说话人识别实验中,基于分类高斯混合模型和神经网络融合的方法在识别性能及噪声鲁棒性上都优于不分类的GMM识别系统,并具有较高的模型训练效率,且可以有效地降低话者模型的混合度和测试语音长度。  相似文献   

12.
The problem of blind source separation (BSS) and system identification for multiple-input multiple-output (MIMO) auto-regressive (AR) mixtures is addressed in this paper. Two new time-domain algorithms for system identification and BSS are proposed based on the Gaussian mixture model (GMM) for sources distribution. Both algorithms are based on the generalized expectation-maximization (GEM) method for joint estimation of the MIMO-AR model parameters and the GMM parameters of the sources. The first algorithm is derived under the assumption of unstructured input signal statistics, while the second algorithm incorporates the prior knowledge about the structure of the input signal statistics due to the statistically independent source assumption. These methods are tested via simulations using synthetic and audio signals. The system identification performances are tested by comparison between the state transition matrix estimation using the proposed algorithms and the well-known multidimensional Yule-Walker solution followed by an instantaneous BSS method. The results show that the proposed algorithms outperform the Yule-Walker based approach. The BSS performances were compared to other convolutive BSS methods. The results show that the proposed algorithms achieve higher signal-to-interference ratio (SIR) compared to the other tested methods.  相似文献   

13.
为提高语音活动检测(VAD)在低信噪比下的准确率,提出了一种基于子带长时信号变化特征的VAD算法.将语音信号转换到频域,并分解为几个不重复的子频带,对这些子带信号分别提取长时信号变化特征,然后采用GMM在线建立语音和非语音模型,以模型的似然比进行VAD判决.实验结果表明,算法在较低的信噪比下能够显著地提高语音活动检测的准确率,且在多种噪声环境和信噪比条件下具有较好的稳健性.应用于语音识别系统的实验表明,该算法能有效提高噪声环境下的语音识别率.  相似文献   

14.
石雪  李玉  赵泉华 《电子学报》2020,48(1):131-136
为了实现自动确定类别数的高精度遥感影像分割,提出一种自适应类别的层次高斯混合模型(Hierarchical Gaussian Mixture Model,HGMM)遥感影像分割算法.提出算法采用多个高斯混合模型加权和定义HGMM,用于建模具有非对称,重尾和多峰等复杂特性的影像统计模型.采用期望最大化算法(Expectation Maximization,EM)求解模型参数.为了实现自动确定类别数,采用贝叶斯信息准则(Bayesian Information Criterion,BIC)求解最优类别数,其中惩罚项采用加权像素数定义.为了验证提出算法可行性和有效性,对模拟和全色遥感影像进行分割实验,并对分割结果进行定性和定量分析.结果表明HGMM具有准确建模复杂统计分布的能力,提出算法具有高精度和高效率,同时可自动确定最优类别数.  相似文献   

15.
利用MCE算法提高说话人识别性能   总被引:8,自引:0,他引:8  
高斯混合模型(GMM)是当今说话人识别的一种流行算法,但GMM的训练的目标是使似然度最大,并不能产生识别性能最佳的模型。本文提出了GMM+MCE(最小分类错误)的模型来解决这一问题,并通过实验证明了其有效性。  相似文献   

16.
邱政权  尹俊勋 《电声技术》2006,(8):43-45,49
在实时平台上,高斯混合模型(GMM)具有计算有效性和易于实现的优点。最大似然规则中,模型参数不断更新,但由于爬山特征,任意的原始模型参数估计通常将导致局部最优;遗传算法(GA)适于求解复杂组合优化问题及非线性函数优化。提出了基于说话人识别的可以解决GMM局部最优问题的GMM/GA新算法,实验结果表明,提出的GMM/GA新算法比纯粹的GMM算法能获得更优的效果。  相似文献   

17.
Total variation (TV) based Models have been widely used in image restoration problems. However, these models are always accompanied by staircase effect due to the property of bounded variation (BV) space. In this paper, we present two high order variational models based on total generalized variation (TGV) with two common and important non-quadratic fidelity data terms for blurred images corrupted by impulsive and Poisson noises. Since the direct extension of alternative direction method of multipliers (ADMM) to solve three-block convex minimization problems is not necessarily convergent, we develop an efficient algorithm called Prediction–Correction ADMM to solve our models and also show the convergence of the proposed method. Moreover, we extend our models to deal with color images restoration. Numerical experiments demonstrate that the proposed high order models can reduce staircase effect while preserving edges and outperform classical TV based models in SNR and SSIM values.  相似文献   

18.
通过对高斯混合模型的数学分析,建立并实现了一种基于高斯混合模型的、AMR-NB与G.729A之间的LSP参数转码算法,并通过实验对高斯混合模型在转码中的一些实际应用问题进行了分析和讨论.实验结果表明,提出的基于高斯混合模型的LSP参数转码算法在合成语音质量不次于DTE方法的同时,LSP参数转码复杂度下降了78%以上.  相似文献   

19.
基于高斯混合模型的车辆字符识别算法   总被引:2,自引:0,他引:2  
在基于统计方法的车牌字符识别算法中,为了更有效地描述车牌字符特征的类条件概率密度,提出了一种基于高斯混合模型(GMM)的识别方法.首先采用Gabor变换来提取车牌字符的特征参数,然后通过GMM来逼近字符特征的类条件概率密度分布,最后根据得到的类条件概率密度分布函数构造贝叶斯分类器.其中,GMM的参数估计采用EM算法.实验表明,这种方法具有良好的字符识别效果、较强的鲁棒性以及较大的应用价值.  相似文献   

20.
由于原始近红外光谱数据中含有与待测组分不相关的噪音及冗余信息,增加了偏最小二乘法(PLS)模型的复杂程度.为了简化儿茶素的预测模型,采用净分析物预处理法(NAP)对近红外光谱进行预处理,提取出待测组分的净分析物信号,然后利用PLS建立绿茶中三种儿茶素(EGCG、ECG和EGC)含量的(NAP/PLS)模型.在模型建立过程中,通过交互验证的方法优化NAP因子数及模型的主成分因子数,并且将NAP的结果与经典的标准正态变量(SNV)光谱预处理结果相比较.比较结果显示,经过NAP与SNV光谱预处理后,模型的预测结果相差不大,但是经过净分析物预处理后,模型的主成分因子数大大降低.研究结果表明,NAP光谱预处理算法能在保证精度的前提下有效地简化绿茶中儿茶素含量的预测模型.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号