期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

张振领贾仰理《计算机工程与设计》2008,29(6):1516-1518

说话人识别是目前身份认证及人工智能领域研究的一个热点,解决说话人识别问题具有重要的理论价值和深远的实用意义.基于语音鲜明个性特征和显著的性别差异,提出了一种考虑性别差异的说话人识别方法,并采用SVM分类器进行训练和测试.先对SVM分类器分别进行性别识别训练和同性集合内个体识别的分类训练,建立起相应的支持向量集合,以此为基础,先后进行说话人的性别识别测试和个体识别测试.实验结果表明,该方法可以有效提高闭集说话人识别系统的性能. 相似文献

2.

说话人识别综述 总被引：1，自引：0，他引：1

刘雪燕张娜袁宝玲《数字社区&智能家居》2009,5(1):169-171

在分析说话人识别原理的基础上,分别从说话人识别的特征提取、说话人模型等方面进行了综述,并讨论了说话人识别的优点和不足,展望了其应用研究的前景。相似文献

3.

说话人识别技术研究

马建郭建东《福建电脑》2005,(1):8-9

说话人识别 ,是指通过说话人的语音来自动识别说话人的身份 ,它主要包括特征提取和模式匹配两个部分。随着计算机技术和人工智能的发展 ,通过说话人识别实现特定场合的实体鉴别已经具有非常重要的研究和应用价值。相似文献

4.

基于特征融合和度量学习的行人行为识别仿真

罗鸿斌《计算机仿真》2021,(6):396-399,404

针对人体行为识别技术存在特征融合精度低、行人轮廓提取噪声高等问题,提出基于特征融合和度量学习的行人行为识别方法.采用离散小波变换方法提取相关行为和轮廓特征,通过K-L变换技术获取图像特征融合数据,利用马氏距离算法实现图片特征度量学习,运用EDM交叉距离完成行人行为相对应的识别.仿真结果表明:研究设计的行为识别方法可以高... 相似文献

5.

说话人识别中LPCCEP倒谱分量的相对重要性 总被引：1，自引：0，他引：1

张华裘雪红《计算机技术与发展》2006,16(4):67-69

文中研究表明，反映说话人特征信息的特征参数矢量的各个分量通常具有不同的分布．对正确识别说话人身份的有效性是有差别的。文中通过增减分量的方法对LPCCEP的各维分量进行分析，得到一个关于LPCCEP参数各维分量的平均贡献序列，将此序列运用于WDMVO有助于系统识别率的提高。相似文献

6.

新颖检测法在说话人识别技术中的应用

石艳王晓晔《现代计算机》2008,(7)

提出一种用于说话人识别中说话人语音特征向量聚类的方法--新颖检测法.通过提取出的特征参数(MFCC和LPCC),建立系统模型,实验结果表明,将新颖检测法结合VQ用于特征向量的分类,较之于单纯的VQ分类,取得了识别率高、稳健型强、确认可靠的效果. 相似文献

7.

基于支持向量机的说话人识别研究

张振领徐东平贾仰理《数字社区&智能家居》2007,(4):255-255,271

解决说话人识别问题具有重要的理论价值和深远的实用意义，本文在研究支持向量机理论的基础上，采用支持向量机的分类算法实现说话人识别系统的训练和测试，并将小波去噪技术应用于说话人识别的预处理过程中，改善进入说话人识别系统的语音质量。实验表明，在说话人识别系统中，支持向量机结合小波去噪可以获得较好的识别率。相似文献

8.

GMM-UBM和SVM在说话人识别中的应用

李荟赵云敏《计算机系统应用》2018,27(1):225-230

针对说话识别领域短语音导致的训练数据不充分的问题,选择能够突出说话人个性特征的GMM-UBM作为基线系统模型,并引入SVM解决GMM-UBM导致的系统鲁棒性差的问题. 选择不同的核函数对SVM的识别性能有较大的影响,针对多项式核函数泛化能力较强、学习能力较差与径向基核函数学习能力较强、泛化能力较差的特性,对两种单核核函数进行线性加权组合,以使组合核函数兼具各单核的优点. 仿真实验结果表明,组合核函数SVM的识别率和等错误率明显优于不引入SVM的GMM-UBM的基线系统及其它三个单核函数,并在不同信噪比情况下也兼顾了系统识别准确率与鲁棒性. 相似文献

9.

对抗样本三元组约束的度量学习算法

下载免费PDF全文

王鑫郭鑫垚魏巍梁吉业《智能系统学报》2021,16(1):30-37

针对已有三元组约束的度量学习算法大多利用先验知识构建约束,一定程度上制约了度量学习算法性能的问题,本文借鉴对抗训练中样本扰动的思想,在原始样本附近学习对抗样本以构造对抗三元组约束,基于对抗三元组和原始三元组约束构建了度量学习模型,提出了对抗样本三元组约束的度量学习算法(metric learning algorithm with adversarial sample triples constraints,ASTCML)。实验结果表明,提出的算法既克服了已有固定约束方法受先验知识影响大的问题,也提高了分类精度,说明区分更加难以区分的三元组约束能够提升算法的性能。相似文献

10.

说话人识别系统研究 总被引：1，自引：0，他引：1

刘刚《网络安全技术与应用》2003,(12):29-31

说话人识别与指纹、脸型等识别技术一样是生物特征识别,是利用包含在说话人的语音波形中特有的个体信息自动识别说话人身份的过程。可广泛用于银行、证券系统、网络安全及军队安全系统中。本文就说话人识别分类、说话人识别实现的物理基础及说话人识别系统的实现方法作了一些分析。相似文献

11.

Extending the relevant component analysis algorithm for metric learning using both positive and negative equivalence constraints

Dit-Yan Yeung Hong Chang 《Pattern recognition》2006,39(5):1007-1010

Relevant component analysis (RCA) is a recently proposed metric learning method for semi-supervised learning applications. It is a simple and efficient method that has been applied successfully to give impressive results. However, RCA can make use of supervisory information in the form of positive equivalence constraints only. In this paper, we propose an extension to RCA that allows both positive and negative equivalence constraints to be incorporated. Experimental results show that the extended RCA algorithm is effective. 相似文献

12.

动作切分和流形度量学习的视频动作识别

下载免费PDF全文

罗会兰赖泽云孔繁胜《中国图象图形学报》2017,22(8):1106-1119

目的为了提高视频中动作识别的准确度,提出基于动作切分和流形度量学习的视频动作识别算法。方法首先利用基于人物肢体伸展程度分析的动作切分方法对视频中的动作进行切分,将动作识别的对象具体化;然后从动作片段中提取归一化之后的全局时域特征和空域特征、光流特征、帧内的局部旋度特征和散度特征,构造一种7×7的协方差矩阵描述子对提取出的多种特征进行融合;最后结合流形度量学习方法有监督式地寻找更优的距离度量算法提高动作的识别分类效果。结果对Weizmann公共视频集的切分实验统计结果表明本文提出的视频切分方法具有很好的切分能力,能够作好动作识别前的预处理;在Weizmann公共视频数据集上进行了流形度量学习前后的识别效果对比,结果表明利用流形度量学习方法对动作识别效果提升2.8%;在Weizmann和KTH两个公共视频数据集上的平均识别率分别为95.6%和92.3%,与现有方法的比较表明,本文提出的动作识别方法有更好的识别效果。结论多次实验结果表明本文算法在预处理过程中动作切分效果理想,描述动作所构造协方差矩阵对动作的表达有良好的多特征融合能力,而且光流信息和旋度、散度信息的加入使得人体各部位的运动方向信息具有了更多细节的描述,有效提高了协方差矩阵的描述能力,结合流形度量学习方法对动作识别的准确性有明显提高。相似文献

13.

一种概率序列核在说话人识别中的应用

下载免费PDF全文

雷震春《计算机工程与应用》2011,47(6):151-155

以说话人识别中的背景模型为基础,根据模型中的各个高斯分量,构造出说话人特征空间,将长度不一样的语句映射成为空间中大小相同的向量,且经过相关矩阵进行规整后,采用线性支持向量机进行说话人识别。借鉴几种常见的特征规整方式,结合语句映射后的向量,提出四种不同的规整方法：均值/方差规整、权重规整、WLOG规整和球形规整,并与概率序列核进行比较研究。根据语音特征向量序列中相邻的特征向量的前后转移关系,结合提出的概率序列核,构造出转移概率序列核。实验在NIST2001库上进行,结果表明概率序列核模型识别性能接近经典的UBM-MAP模型,将这两类模型得分进行融合,可非常明显地提高识别性能,进一步融合转移概率序列核后,性能还可提高19.1%。相似文献

14.

基于矢量量化的说话人识别研究 总被引：7，自引：0，他引：7

周星王成友孟晨杨锁昌魏保华《计算机工程与设计》2002,23(11):12-14,62

说话人识别可以看作语音识别的一种，是当前研究的热点之一。阐明了说话人识别的基本概念、发展状况以及原理和方法，并介绍了一种基于矢量量化的且与文本无关的说话人识别系统。相似文献

15.

改进的美尔倒谱系数用于说话人识别研究

刘宏刘立群《计算机工程与应用》2012,48(8):155-157

基于人耳听觉感知的MFCC较其他说话人特征具有强抗噪性、高识别率特点。考虑美尔滤波器组的结构,其只在低频区具有较高的分辨率,在高频区分辨率却较低,这样势必会遗失一些包含在高频区域的重要信息。利用反美尔域下的特征R-MFCC与MFCC的各自优点,将R-MFCC与MFCC结合,形成优势互补,并给出了衡量各种特征参数识别能力的Fisher准则,结合Fisher准则构造出一种新的混合特征参数。采用支持向量机分别以MFCC、R-MFCC以及新构造的混合特征为参数进行说话人的识别,实验证明基于Fisher准则的优选混合特征作为说话人识别特征是可行的。相似文献

16.

Compositional metric learning for multi-label classification

Yan-Ping SUN Min-Ling ZHANG 《Frontiers of Computer Science》2021,15(5):155320

Multi-label classification aims to assign a set of proper labels for each instance, where distance metric learning can help improve the generalization ability of instance-based multi-label classification models. Existing multi-label metric learning techniques work by utilizing pairwise constraints to enforce that examples with similar label assignments should have close distance in the embedded feature space. In this paper, a novel distance metric learning approach for multi-label classification is proposed by modeling structural interactions between instance space and label space. On one hand, compositional distance metric is employed which adopts the representation of a weighted sum of rank-1 PSD matrices based on component bases. On the other hand, compositional weights are optimized by exploiting triplet similarity constraints derived from both instance and label spaces. Due to the compositional nature of employed distance metric, the resulting problem admits quadratic programming formulation with linear optimization complexity w.r.t. the number of training examples.We also derive the generalization bound for the proposed approach based on algorithmic robustness analysis of the compositional metric. Extensive experiments on sixteen benchmark data sets clearly validate the usefulness of compositional metric in yielding effective distance metric for multi-label classification. 相似文献

17.

基于标签进行度量学习的图半监督学习算法

吕亚丽苗钧重胡玮昕《计算机应用》2005,40(12):3430-3436

大多基于图的半监督学习方法，在样本间相似性度量时没有用到已有的和标签传播过程中得到的标签信息，同时，其度量方式相对固定，不能有效度量出分布结构复杂多样的数据样本间的相似性。针对上述问题，提出了基于标签进行度量学习的图半监督学习算法。首先，给定样本间相似性的度量方式，从而构建相似度矩阵。然后，基于相似度矩阵进行标签传播，筛选出k个低熵样本作为新确定的标签信息。最后，充分利用所有标签信息更新相似性度量方式，重复迭代优化直至学出所有标签信息。所提算法不仅利用标签信息改进了样本间相似性的度量方式，而且充分利用中间结果降低了半监督学习对标签数据的需求量。在6个真实数据集上的实验结果表明，该算法在超过95%的情况下相较三种传统的基于图的半监督学习算法取得了更高的分类准确率。相似文献

18.

通过分离语音空间和说话人空间的说话人识别

下载免费PDF全文

邱政权尹俊勋《计算机工程与应用》2008,44(12):212-214

在说话人空间中,存在语音特征随句子和时间差异而变化的问题。这个变化主要是由语音数据中的语音信息和说话人信息的变化引起的。如果把这两种信息彼此分离就能实现鲁棒的说话人识别。在假设大的说话人变量的空间为“语音空间”和小的说话人变量的空间为“说话人空间”的情况下,通过子空间方法分离语音信息和说话人信息,提出了说话人辨认和说话人确认方法。结果显示：通过相对于传统方法的比较试验,能用小量训练数据建立鲁棒说话人模型。相似文献

19.

基于标签进行度量学习的图半监督学习算法

吕亚丽苗钧重胡玮昕《计算机应用》2020,40(12):3430-3436

大多基于图的半监督学习方法,在样本间相似性度量时没有用到已有的和标签传播过程中得到的标签信息,同时,其度量方式相对固定,不能有效度量出分布结构复杂多样的数据样本间的相似性。针对上述问题,提出了基于标签进行度量学习的图半监督学习算法。首先,给定样本间相似性的度量方式,从而构建相似度矩阵。然后,基于相似度矩阵进行标签传播,筛选出k个低熵样本作为新确定的标签信息。最后,充分利用所有标签信息更新相似性度量方式,重复迭代优化直至学出所有标签信息。所提算法不仅利用标签信息改进了样本间相似性的度量方式,而且充分利用中间结果降低了半监督学习对标签数据的需求量。在6个真实数据集上的实验结果表明,该算法在超过95%的情况下相较三种传统的基于图的半监督学习算法取得了更高的分类准确率。相似文献