共查询到20条相似文献,搜索用时 15 毫秒
1.
说话人识别作为当今的一个研究热点,具有广泛的应用和研究前景。文章针对说话人识别的前端处理进行了相关研究,设计并实现了一个有效的处理算法。提取出Mel频率倒谱系数MFCC,讨论了MFCC各维参数对最终结果的贡献。文章通过研究高斯混合模型GMM的模型训练,使用最大似然估计算法和期望一最大化算法,在研究和改进基础上开发了一个基于高斯混合模型的说话人识别系统。同时完成了多线程并行测试与MFEC各维参数对最终识别结果的增益比较研究。 相似文献
2.
在研究说话人识别系统时,分别从特征参数的选取和识别训练两种不同角度分析了加权特征向量和群模型在增强系统性能方面的可行性,并采用群模型与加权特征向量相结合的方式建立与文本无关的说话人确认系统.试验结果表明,含加权特征向量的群模型比传统的矢量量化有更高的辨识率,而且错误拒绝率在一定的错误接受率下也有显著降低. 相似文献
3.
4.
5.
基于支撑向量机的说话人确认系统 总被引:2,自引:1,他引:1
支撑向量机(SVM)是一种新的统计学习方法,和以往的学习方法不同的是SVM的学习原则是使结构风险(Structural Risk)最小,而经典的学习方法遵循经验风险(Empirical Risk)最小原则,这使得SVM具有较好的总体性能.文章提出一种基于支撑向量机的文本无关的说话人确认系统,实验表明同基于向量量化(VQ)和高斯混合模式(GMM)的经典方法相比,基于SVM的方法具有更高的区分力和更好的总体性能. 相似文献
6.
说话人识别是根据检测到的语音进行说话人身份的认证.是将待识别语音与数据库中的说话人语音进行匹配的过程。设计基于高斯混合模型(GMM)说话人识别系统,提取输入语音的Mel倒谱系数作为观察向量,用GMM算法进行说话人语音模型训练和识别。同时设计基于TMS320DM3730DSP的嵌入式硬件平台,并在该平台上实现所设计的说话人识别系统。为进行性能测试,自行录制相应的语音材料库,录音的人数为38人,其中男19人,女19人。经测试表明,在正常环境下.该设计的说话人系统识别率可达到95%以上。 相似文献
7.
基于说话人聚类和支持向量的说话人确认研究 总被引:2,自引:0,他引:2
说话人确认系统需要用目标说话人和背景模型说话人的语音数据对模型进行训练。背景模型说话人可随机选或选取与目标说话人相近的说话人,采用说话人聚类的方法可以有效地解决说话人背景模型的选取问题。支持向量机用作说话人确认模型来训练目标说话人和背景说话人的语音数据,实验表明该方法地与文本无关的说话人确认问题是有效的。 相似文献
8.
在嵌入式系统应用中,如果能够创建仿真环境,并利用仿真环境的优势进行算法的验证、系统的移植、应用程序的设计,就能够极大地提高开发的灵活性,节省开发资源,验证系统的可行性.文巾分析了开放源码的嵌入式系统仿真集成开发环境SkyEye,并实现在该软件平台上基于ARM7TDMI核的AT91EV40仿真开发饭的实时操作系统μC/OS-Ⅱ的移植.把语音识别从试验室推广到实际应用中,在嵌入式系统中进行研究是必然的要求.在该嵌入式软硬什仿真平台上实现说话人识别算法的研究,选取改进了配合于硬件的算法,取得了良好的效果. 相似文献
9.
10.
11.
基于说话人聚类和支持向量机的说话人确认研究 总被引:3,自引:1,他引:3
说话人确认系统需要用目标说话人和背景模型说话人的语音数据对模型进行训练。背景模型说话人可随机选取或选取与目标说话人相近的说话人。采用说话人聚类的方法可以有效地解决说话人背景模型的选取问题。支持向量机用作说话人确认模型来训练目标说话人和背景说话人的语音数据。实验表明该方法对与文本无关的说话人确认问题是有效的。 相似文献
12.
13.
实现了一个基于高斯混合模型(GMM)的说话人辨识系统。GMM是用多个高斯分布的概率密度函数的组合来描述特征矢量在概率空间的分布状况,不同的说话人对应了不同的GMM。模型的训练采取了极大似然估计(ML)的EM方法。并在不同的数据集上实验,得到了好的结果。 相似文献
14.
论文介绍了一个基于DSP的说话人确认系统,该系统确认算法建立于高斯混合模型-全局背景模型(GMM-UBM)的基础上,并在特征空间采用一种新的基于信息熵特征融合的算法,实验结果表明在不影响识别率的情况下,该算法计算量比传统的特征关联融合的要减少以上,比归一化融合要少。硬件系统采用高速DSP芯片TMS320C6701,为确认算法的实时实现提供了保证。 相似文献
15.
通过分析GMM(高斯混合模型)的说话人辨认系统的性能,提出了一种捕捉不同说话人交互信息的人工神经网络(ANN)方法,构成一个GMM/ANN混合说话人辨认系统。实验表明,GMM/ANN混合系统的说话人辨认能够取得比基于GMM和基于MLP(多层感知器)更高的辨认率。 相似文献
16.
该文介绍了一种基于矢量量化(VQ)方法的一个说话人识别算法。基于矢量量化的说话人识别,因其运算过程简单等特点,在说话人识别领域有着广泛的应用。用不同语音参数进行实验,实验表明应用矢量量化的方法用在说话人识别中是一种有效方法。 相似文献
17.
为了提高噪声中的说话人识别率,根据各维倒谱系数鉴别能力的不同,在识别过程中对GMM(Gauss mixture model)模型的各维分量直接加权,提出了直接倒谱加权的GMM模型,并且研究了在噪声情况下衡量各维特征鉴别能力的新方法。将该方法与MMSE(Minimum mean square error)相融合,对白噪声和地铁噪声进行实验,得到基线系统和MMSE增强系统在不同噪声情况下最优的加权窗函数。试验结果表明,直接倒谱加权GMM能显著提高系统识别精度。 相似文献
18.
19.
在高斯混合模型(Gaussian Mixture Model,GMM)训练时,对传统的模型参数初始化方法(随机法、K均值聚类法)进行改进,提出分裂法与K均值聚类相结合的新方法。实验表明,采用改进的方法与传统方法相比,系统平均识别率有15.47%和7.5%的提高。研究了GMM的阶数、协方差阈值、预加重系数对系统识别率的影响。对实验结果进行详细分析,并根据实验数据,取它们各自表现最好的值,从而使构建的说话人识别系统获得一个较高的识别率。实验表明,在规定的实验条件下,系统可达到90%以上的识别率。 相似文献
20.
针对现有说话人识别系统识别率不高,鲁棒性能差的缺点,提出了一种基于超向量的核函数构造方法.通过对超向量进行KL散度变换和L2线性内积变换,分别得到KL散度线性核函数、KL散度非线性核函数以及L2内积核函数.实验结果表明,将这三种核函数分别应用于支持向量机的说话人识别系统,可以得到优于常规核函数的识别性能. 相似文献