期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

王伟韩纪庆郑铁然郑贵滨陶耀《电子与信息学报》2016,38(2):367-372

稀疏表示已成功应用于说话人识别领域。在稀疏表示中,构造好的字典起着重要的作用。该文将Fisher准则的结构化字典学习方法引入说话人识别系统。在判别字典的学习过程中,每一个字典对应一个类标签,因此同类别训练样本的重构误差较小。同时,保证训练样本的稀疏编码系数类内误差最小,类间误差最大。在NIST SRE 2003数据库上,实验结果表明该算法得到的等错误率是7.62%,基于余弦距离打分的i-vector的等错误率是6.7%。当两个系统融合后,得到的等错误率是5.07%。相似文献

2.

基于判别邻域嵌入的人脸识别

王国强欧宗瑛王海燕苏铁明《光电子．激光》2008,19(5):700-703

提出了一种人脸识别子空间方法:判别邻域嵌入(DNE).在框架中,训练样本数据的邻域和类关系被用来构建低维嵌入流形.在嵌入低维子空间后,同类样本保持它们固有的邻域关系,相反不同类近邻样本彼此远离.在ORL和Yale人脸数据库上,对提出的方法和主成分分析(PCA)、线性判别分析(LDA)、保持邻域嵌入(NPE)和保持局部投影(LPP)方法进行了比较,结果表明,提出的方法是有效的. 相似文献

3.

基于加权特征值补偿的说话人识别 总被引：3，自引：0，他引：3

于鹏徐义芳曹志刚《信号处理》2002,18(6):513-517

背景噪声的存在,使得说话人识别系统的训练环境和测试环境发生失配,导致系统性能发生急剧下降。本论文提出一种加权特征值补偿算法,把由噪声引起的使带噪语音信号特征值与纯净语音特征值发生偏差的部分去除,从而使进入识别器的特征值接近纯净语音的特征值。在特征值补偿过程中引入了信噪比加权的方法。实验表明,这种方法能够有效的提高说话人识别系统的性能。相似文献

4.

基于修正EM算法的说话人识别的研究

成新民沈律赵力邹采荣《电声技术》2004,(12):51-53

提出了针对说话人识别的GMM模型训练的新方法。理论推导和实验结果表明,与GMM常用的传统EM算法相比,提出的新算法能够解决训练中会出现奇异阵的问题,并能提高系统识别率。相似文献

5.

说话人识别综述 总被引：2，自引：0，他引：2

杨迪戚银城刘明军张华芳子武军娜《电子科技》2012,25(6):162-165

在分析说话人识别原理和方法的基础上,对近年来说话人识别技术的发展进行了综述。分析了当前说话人识别技术中使用的多种特征和模式识别方法,并对其今后的研究前景和发展方向进行了展望。相似文献

6.

基于i-vector说话人识别算法中训练时长研究

《现代电子技术》2016,(14)

为了进一步提升i-vector说话人识别模型的系统性能,探讨了基于i-vector的说话人识别系统中训练时长、男女比例和高斯混合度对系统识别性能的影响。针对训练时长、男女比例和高斯混合度设置了一组实验,结合目前最流行的语音识别工具Kaldi进行验证,得出i-vector说话人识别算法的最佳参数,为以后的基于i-vector说话人识别算法研究提供数据依据。相似文献

7.

说话人识别的几种方法 总被引：5，自引：1，他引：4

宁飞陈频《电声技术》2001,(12):9-14

以说话人识别的几个关键问题为纲,说明了国内外现有的识别方法和结果,以及存在的问题和难点,并提出了一些新想法。相似文献

8.

说话人识别技术探讨

高会贤郑晓势赵彦玲《电声技术》2008,32(1):52-55

介绍了说话人识别技术的基本概念和发展历史,列举并比较了几种常用的特征提取和模式匹配方法,总结了当前存在的问题并对其发展进行了展望. 相似文献

9.

利用MCE算法提高说话人识别性能 总被引：8，自引：0，他引：8

李晓宇李虎生刘加刘润生《电路与系统学报》2000,5(3):46-49

高斯混合模型（ＧＭＭ）是当今说话人识别的一种流行算法,但ＧＭＭ的训练的目标是使似然度最大,并不能产生识别性能最佳的模型。本文提出了ＧＭＭ＋ＭＣＥ（最小分类错误）的模型来解决这一问题,并通过实验证明了其有效性。相似文献

10.

基于VQ的说话人识别技术研究

檀蕊莲《信息技术》2010,34(8):103-104

说话人识别是语音识别的一种特殊方式,其目的不是识别语音内容,而是识别说话人是谁,即从语音信号中提取个人特征。采用矢量量化（VQ）可避免困难的语音分段问题和时间归整问题,且作为一种数据压缩手段可大大减少系统所需的数据存储量。通过说话人识别相关技术的研究,提出并设计了一个基于VQ的说话人识别系统,实验证明,当用于训练的数据量较小时,可以得到比较稳定的识别性能。相似文献

11.

一种半监督稀疏保持近邻判别嵌入算法

李世银王飞彭超孙娇娇《电视技术》2013,37(3)

保持近邻嵌入（NPE）算法对局部线性嵌入（LLE）算法进行了改进,克服了新来样本问题,但在处理分类问题上表现不足。本文提出了一种半监督稀疏保持近邻判别嵌入算法,该方法首先采用小波变换对数据进行预处理,然后执行等距离映射(Isomap)算法选择合适的低维嵌入维数,最后结合稀疏表示理论、NPE和线性判别分析（LDA）的思想,重构邻域图,并在建立目标函数时使得已标签信息中同类样本点之间相互靠近,异类样本点之间相互远离,未标签信息邻域信息得以保持,这样,既得到了高维映射函数,又提高了分类正确率。通过在人脸数据库上实验,并和其他半监督算法作比较,本文提出的算法在识别率上表现较好。相似文献

12.

基于自适应近邻图嵌入的局部鉴别投影算法

王永茂徐正光赵珊《电子与信息学报》2013,35(3):633-638

针对局部Fisher鉴别分析(LFDA)中样本近邻点个数对于最优投影方向的影响以及在度量类间离差度时未考虑不同类别样本近邻点的两点不足之处,该文提出一种基于自适应近邻图嵌入的局部鉴别投影算法,根据样本分布以及样本间的相似度自适应计算类内和类间近邻点,依据类内类间近邻点的个数定义局部类内与类间离差矩阵中的权值矩阵,通过最大化局部类间离差度最小化局部类内离差度,得到最优低维子空间。该算法不仅能够保持样本的局部信息,而且能够保持样本的鉴别信息,在人工数据以及标准数据库上的实验表明该方法是有效的。相似文献

13.

基于局部边界鉴别分析的人脸识别

李子荣杜明辉《电子与信息学报》2009,31(3):527-531

该文基于谱图理论和流形学习提出了局部边界鉴别分析(LMDA)的降维方法。在近邻保持投影的基础上,LMDA方法减少了同类数据间由于线性投影而带来的重构误差,同时保留了类内相似度图的拉普拉斯矩阵的完整性。另一方面,通过构造一个与类内相似图对应的类外代价图,LMDA可以扩大两者间的边界。在人脸识别中与其他方法的对比实验表明提出的算法能有效提升近邻保持投影的性能。相似文献

14.

面向高光谱图像分类的半监督Laplace鉴别嵌入

李志敏张杰黄鸿马泽忠《电子与信息学报》2015,37(4):995-1001

为有效提取出高光谱遥感图像数据的鉴别特征,该文阐述一种融合标记样本中鉴别信息和无标记样本中局部结构信息的半监督Laplace鉴别嵌入(SSLDE)算法。该算法利用标记样本的类别信息来保持样本集的可分性,并通过构建标记样本和无标记样本的Laplace矩阵来发现样本集中局部流形结构,实现半监督的流形鉴别。在KSC 和Urban数据集上的实验结果说明：该算法具有更高的分类精度,可以有效地提取出鉴别特征信息。在总体分类精度上,该算法比半监督最大边界准则(SSMMC)算法提升了6.3%~7.4%,比半监督流形保持嵌入(SSSMPE)算法提升了1.6%~4.4%。相似文献

15.

基于聚类统计与文本无关的说话人识别研究 总被引：6，自引：2，他引：4

邓浩江王守觉邢藏菊李倩《电路与系统学报》2001,6(3):77-80

从语音信号特征矢量的空间映射出发,在二元分裂算法的基础上提出了一种裂合并的聚类算法,并用于与本文无关的说话人识别研究,初步建立了基于聚类统计的开放系统,该系统用说话人语音信号在特征空间的分布中心建立参考模板,用聚类统计中心代替待识语音段的特征矢量进行了模式匹配计算,系统规模的越大,节省的计算量就越多。在小规模说话人辨认系统的实践研究中,研究了特征矢量的加权,语音段的时长以及a因子的选择对系统性能的影响。相似文献

16.

鉴别投影嵌入及其在人脸识别中的应用

严严章毓晋《电子与信息学报》2008,30(12):2902-2905

该文提出了一种新的监督线性降维方法,称为鉴别投影嵌入(Discriminant Projection Embedding, DPE)。和常用的线性鉴别分析相比,鉴别投影嵌入可以更好地保留类内的局部几何位置信息和提取类间的鉴别结构信息。在人脸识别公用数据库上进行了一系列的实验,实验结果表明了该文方法的可行性和有效性。相似文献

17.

基于多模态生成对抗网络和三元组损失的说话人识别

陈莹陈湟康《电子与信息学报》2020,42(2):379-385

为了挖掘说话人识别领域中人脸和语音的相关性,该文设计多模态生成对抗网络(GAN),将人脸特征和语音特征映射到联系更加紧密的公共空间,随后利用3元组损失对两个模态的联系进一步约束,拉近相同个体跨模态样本的特征距离,拉远不同个体跨模态样本的特征距离。最后通过计算公共空间特征的跨模态余弦距离判断人脸和语音是否匹配,并使用Softmax识别说话人身份。实验结果表明,该方法能有效地提升说话人识别准确率。

相似文献

18.

混合粒子对优化算法在说话人识别中的应用

薛丽萍尹俊勋周家锐纪震《电子与信息学报》2009,31(6):1359-1362

在粒子群优化(Particle Swarm Optimization, PSO)和混合蛙跳算法(Shuffled Frog-Leaping Algorithm, SFLA)的基础上,该文提出了一种新的混合粒子对优化(Shuffled Particle-Pair Optimizer, SPPO)算法,应用于矢量量化的说话人识别。该算法将全局信息交换和局部深度搜索相结合寻求最佳的说话人码本。群体按适应值分为3个粒子对,每个粒子对由两个粒子构成,按先后顺序执行PSO算法中的速度位置更新和LBG算法以实现局部细致搜索,间隔一定的迭代次数通过SFLA混合策略实现粒子对间的信息交换,从而使群体向全局最优解靠近。实验结果表明,本算法始终稳定地取得显著优于LBG,FCM,FRLVQ-FVQ和PSO算法的说话人识别性能,较好地解决了初始码本影响的识别性能的问题,且在计算时间和收敛速度方面有相当的优势。相似文献

19.

基于HMM的说话人辨认系统及其改进 总被引：2，自引：0，他引：2

张玲华杨震郑宝玉《电讯技术》2003,43(6):86-89

对基于隐马尔可夫模型(HMM)的说话人辨认系统进行了讨论,完成了系统设计。对系统中矢量量化这一关键性环节进行了改进,提出了一种新的基于遗传算法的码本生成方法。测试结果表明,改进后的系统具有较高的正确识别率,特别是在与文本无关的情况下。相似文献