共查询到19条相似文献,搜索用时 62 毫秒
1.
稀疏表示已成功应用于说话人识别领域。在稀疏表示中,构造好的字典起着重要的作用。该文将Fisher准则的结构化字典学习方法引入说话人识别系统。在判别字典的学习过程中,每一个字典对应一个类标签,因此同类别训练样本的重构误差较小。同时,保证训练样本的稀疏编码系数类内误差最小,类间误差最大。在NIST SRE 2003数据库上,实验结果表明该算法得到的等错误率是7.62%,基于余弦距离打分的i-vector的等错误率是6.7%。当两个系统融合后,得到的等错误率是5.07%。 相似文献
2.
3.
4.
5.
6.
7.
8.
9.
10.
说话人识别是语音识别的一种特殊方式,其目的不是识别语音内容,而是识别说话人是谁,即从语音信号中提取个人特征。采用矢量量化(VQ)可避免困难的语音分段问题和时间归整问题,且作为一种数据压缩手段可大大减少系统所需的数据存储量。通过说话人识别相关技术的研究,提出并设计了一个基于VQ的说话人识别系统,实验证明,当用于训练的数据量较小时,可以得到比较稳定的识别性能。 相似文献
11.
保持近邻嵌入(NPE)算法对局部线性嵌入(LLE)算法进行了改进,克服了新来样本问题,但在处理分类问题上表现不足。本文提出了一种半监督稀疏保持近邻判别嵌入算法,该方法首先采用小波变换对数据进行预处理,然后执行等距离映射(Isomap)算法选择合适的低维嵌入维数,最后结合稀疏表示理论、NPE和线性判别分析(LDA)的思想,重构邻域图,并在建立目标函数时使得已标签信息中同类样本点之间相互靠近,异类样本点之间相互远离,未标签信息邻域信息得以保持,这样,既得到了高维映射函数,又提高了分类正确率。通过在人脸数据库上实验,并和其他半监督算法作比较,本文提出的算法在识别率上表现较好。 相似文献
12.
针对局部Fisher鉴别分析(LFDA)中样本近邻点个数对于最优投影方向的影响以及在度量类间离差度时未考虑不同类别样本近邻点的两点不足之处,该文提出一种基于自适应近邻图嵌入的局部鉴别投影算法,根据样本分布以及样本间的相似度自适应计算类内和类间近邻点,依据类内类间近邻点的个数定义局部类内与类间离差矩阵中的权值矩阵,通过最大化局部类间离差度最小化局部类内离差度,得到最优低维子空间。该算法不仅能够保持样本的局部信息,而且能够保持样本的鉴别信息,在人工数据以及标准数据库上的实验表明该方法是有效的。 相似文献
13.
该文基于谱图理论和流形学习提出了局部边界鉴别分析(LMDA)的降维方法。在近邻保持投影的基础上,LMDA方法减少了同类数据间由于线性投影而带来的重构误差,同时保留了类内相似度图的拉普拉斯矩阵的完整性。另一方面,通过构造一个与类内相似图对应的类外代价图,LMDA可以扩大两者间的边界。在人脸识别中与其他方法的对比实验表明提出的算法能有效提升近邻保持投影的性能。 相似文献
14.
为有效提取出高光谱遥感图像数据的鉴别特征,该文阐述一种融合标记样本中鉴别信息和无标记样本中局部结构信息的半监督Laplace鉴别嵌入(SSLDE)算法。该算法利用标记样本的类别信息来保持样本集的可分性,并通过构建标记样本和无标记样本的Laplace矩阵来发现样本集中局部流形结构,实现半监督的流形鉴别。在KSC 和Urban数据集上的实验结果说明:该算法具有更高的分类精度,可以有效地提取出鉴别特征信息。在总体分类精度上,该算法比半监督最大边界准则(SSMMC)算法提升了6.3%~7.4%,比半监督流形保持嵌入(SSSMPE)算法提升了1.6%~4.4%。 相似文献
15.
16.
该文提出了一种新的监督线性降维方法,称为鉴别投影嵌入(Discriminant Projection Embedding, DPE)。和常用的线性鉴别分析相比,鉴别投影嵌入可以更好地保留类内的局部几何位置信息和提取类间的鉴别结构信息。在人脸识别公用数据库上进行了一系列的实验,实验结果表明了该文方法的可行性和有效性。 相似文献
17.
为了挖掘说话人识别领域中人脸和语音的相关性,该文设计多模态生成对抗网络(GAN),将人脸特征和语音特征映射到联系更加紧密的公共空间,随后利用3元组损失对两个模态的联系进一步约束,拉近相同个体跨模态样本的特征距离,拉远不同个体跨模态样本的特征距离。最后通过计算公共空间特征的跨模态余弦距离判断人脸和语音是否匹配,并使用Softmax识别说话人身份。实验结果表明,该方法能有效地提升说话人识别准确率。
相似文献18.
在粒子群优化(Particle Swarm Optimization, PSO)和混合蛙跳算法(Shuffled Frog-Leaping Algorithm, SFLA)的基础上,该文提出了一种新的混合粒子对优化(Shuffled Particle-Pair Optimizer, SPPO)算法,应用于矢量量化的说话人识别。该算法将全局信息交换和局部深度搜索相结合寻求最佳的说话人码本。群体按适应值分为3个粒子对,每个粒子对由两个粒子构成,按先后顺序执行PSO算法中的速度位置更新和LBG算法以实现局部细致搜索,间隔一定的迭代次数通过SFLA混合策略实现粒子对间的信息交换,从而使群体向全局最优解靠近。实验结果表明,本算法始终稳定地取得显著优于LBG,FCM,FRLVQ-FVQ和PSO算法的说话人识别性能,较好地解决了初始码本影响的识别性能的问题,且在计算时间和收敛速度方面有相当的优势。 相似文献
19.
基于HMM的说话人辨认系统及其改进 总被引:2,自引:0,他引:2
对基于隐马尔可夫模型(HMM)的说话人辨认系统进行了讨论,完成了系统设计。对系统中矢量量化这一关键性环节进行了改进,提出了一种新的基于遗传算法的码本生成方法。测试结果表明,改进后的系统具有较高的正确识别率,特别是在与文本无关的情况下。 相似文献