期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

基于duffing随机共振的说话人特征提取方法 总被引：2，自引：0，他引：2

潘平何朝霞《计算机工程与应用》2012,48(35):123-125,142

说话人特征参数的提取直接影响识别模型的建立,MFCC与LPC参数提取方法,分别以局域低频信息和全局AR信号为主要特征。提出一种基于duffing随机共振的说话人频谱特征提取方法。仿真结果表明,该方法能识别说话人之间频谱的微小差别,有效地提取说话人频谱的基本特征,从而为说话人识别模型提供更为精细的识别模型。相似文献

2.

说话人识别综述 总被引：1，自引：0，他引：1

刘雪燕张娜袁宝玲《数字社区&智能家居》2009,5(1):169-171

在分析说话人识别原理的基础上,分别从说话人识别的特征提取、说话人模型等方面进行了综述,并讨论了说话人识别的优点和不足,展望了其应用研究的前景。相似文献

3.

基于矢量量化的说话人识别研究 总被引：7，自引：0，他引：7

周星王成友孟晨杨锁昌魏保华《计算机工程与设计》2002,23(11):12-14,62

说话人识别可以看作语音识别的一种，是当前研究的热点之一。阐明了说话人识别的基本概念、发展状况以及原理和方法，并介绍了一种基于矢量量化的且与文本无关的说话人识别系统。相似文献

4.

基于PCANN的说话人识别方法研究 总被引：1，自引：0，他引：1

张银娟张玲华曹远星《计算机与信息技术》2006,(Z1)

本文利用主分量分析神经网络(PCANN)方法,得到一种新的说话人语音特征。该特征通过对相继几帧语音特征参数组成的特征向量作主分量分析得到.新的特征能有效的引入帧间相关信息,减小冗余度,削弱噪声的影响。实验表明,新特征提高了系统的识别性能。相似文献

5.

基于SIFT的说话人唇动识别

马新军吴晨晨仲乾元李园园《计算机应用》2017,37(9):2694-2699

针对唇部特征提取维度过高以及对尺度空间敏感的问题,提出了一种基于尺度不变特征变换（SIFT）算法作特征提取来进行说话人身份认证的技术。首先,提出了一种简单的视频帧图片规整算法,将不同长度的唇动视频规整到同一的长度,提取出具有代表性的唇动图片;然后,提出一种在SIFT关键点的基础上,进行纹理和运动特征的提取算法,并经过主成分分析（PCA）算法的整合,最终得到具有代表性的唇动特征进行认证;最后,根据所得到的特征,提出了一种简单的分类算法。实验结果显示,和常见的局部二元模式（LBP）特征和方向梯度直方图（HOG）特征相比较,该特征提取算法的错误接受率（FAR）和错误拒绝率（FRR）表现更佳。说明整个说话人唇动特征识别算法是有效的,能够得到较为理想的结果。相似文献

6.

基于FVQMM的说话人识别方法

杨彦赵力《数据采集与处理》2015,30(6):1233-1239

为了进一步提高基于高斯混合模型的与文本无关说话人识别系统的识别性能,本文针对高斯混合模型在建模时需要较多的训练数据的缺陷,提出了一种新的应用于小样本说话人识别系统的与文本无关说话人识别方法,该方法综合考虑了模糊集理论、矢量量化和高斯混合模型的优点,通过用模糊矢量量化误差尺度取代传统高斯混合模型的输出概率函数,减少了建模时对训练数据量的要求,提高了模型精度和识别速度。同时由于模糊集理论起到了“数据整形”的作用,所以增强了目标说话人数据的相似性。实验结果表明该方法针对小样本数据的说话人识别系统,识别性能优于传统的基于高斯混合模型的说话人识别系统。相似文献

7.

基于量子模距离的说话人识别方法

《计算机工程与科学》2014,(1)

概率测度和距离测度是模式识别最基本的两种测度,矢量量化算法是典型的基于距离测度的模式识别算法。根据量子模距离测度理论,在矢量量化算法的基础上,探索一种基于量子模距离的说话人识别方法。该方法针对说话人语音的时变性、随机性、特征维数较高等特点,将一帧语音信号视为一个量子态,并根据量子测量理论,对量子态之间进行模距离测量,从而对量子态进行有效的分类和聚类。研究表明该方法能有效地降低语音信号处理的复杂度。在经典计算机上的仿真表明,该方法在运行时间上略优于矢量量化算法,在识别率上明显优于矢量量化算法,为说话人识别的理论研究提供了新的途径。相似文献

8.

基于量子模距离的说话人识别方法 总被引：1，自引：0，他引：1

罗辉潘平王洋《计算机工程与科学》2014,36(1):39-43

概率测度和距离测度是模式识别最基本的两种测度,矢量量化算法是典型的基于距离测度的模式识别算法。根据量子模距离测度理论,在矢量量化算法的基础上,探索一种基于量子模距离的说话人识别方法。该方法针对说话人语音的时变性、随机性、特征维数较高等特点,将一帧语音信号视为一个量子态,并根据量子测量理论,对量子态之间进行模距离测量,从而对量子态进行有效的分类和聚类。研究表明该方法能有效地降低语音信号处理的复杂度。在经典计算机上的仿真表明,该方法在运行时间上略优于矢量量化算法,在识别率上明显优于矢量量化算法,为说话人识别的理论研究提供了新的途径。相似文献

9.

说话人识别系统研究 总被引：1，自引：0，他引：1

刘刚《网络安全技术与应用》2003,(12):29-31

说话人识别与指纹、脸型等识别技术一样是生物特征识别,是利用包含在说话人的语音波形中特有的个体信息自动识别说话人身份的过程。可广泛用于银行、证券系统、网络安全及军队安全系统中。本文就说话人识别分类、说话人识别实现的物理基础及说话人识别系统的实现方法作了一些分析。相似文献

10.

基于MFCC和LPCC的说话人识别 总被引：8，自引：0，他引：8

余建潮张瑞林《计算机工程与设计》2009,30(5)

MFCC参数和LPCC参数是说话人识别中两种最常用的特征参数,研究了MFCC和LPCC参数提取的算法原理及差分倒谱参数的提取方法,采用MFCC、LPCC及其一阶、二阶差分作为特征参数,通过k均值算法与三层BP神经网络来进行说话人识别.实验结果表明,该方法可以有效提高识别率,同时也验证MFCC参数的鲁棒性优于LPCC参数. 相似文献

11.

基于保局部核RVM的说话人识别方法

下载免费PDF全文

郑泽萍王万良郑建炜《计算机工程》2011,37(14):208-210

针对说话人语音特征随音量、情绪、健康等因素变化呈现出的复杂分布结构,提出一种基于保局部核相关向量机(RVM)的说话人识别方法。在RVM模型所采用的高斯核函数中引入相似度因子,以保留数据局部结构,构成保局部核RVM模型。在模型训练过程中采用快速算法以避免大型矩阵逆操作,减少计算量,可适用于大样本场合。应用结果表明,该方法能加快测试速度,提高分类精度。相似文献

12.

基于支持向量机的说话人识别研究

张振领徐东平贾仰理《数字社区&智能家居》2007,2(7):255

解决说话人识别问题具有重要的理论价值和深远的实用意义,本文在研究支持向量机理论的基础上,采用支持向量机的分类算法实现说话人识别系统的训练和测试,并将小波去噪技术应用于说话人识别的预处理过程中,改善进入说话人识别系统的语音质量。实验表明,在说话人识别系统中,支持向量机结合小波去噪可以获得较好的识别率。相似文献

13.

新颖检测法在说话人识别技术中的应用

石艳王晓晔《现代计算机》2008,(7)

提出一种用于说话人识别中说话人语音特征向量聚类的方法--新颖检测法.通过提取出的特征参数(MFCC和LPCC),建立系统模型,实验结果表明,将新颖检测法结合VQ用于特征向量的分类,较之于单纯的VQ分类,取得了识别率高、稳健型强、确认可靠的效果. 相似文献

14.

基于GMM与改进MCE训练的说话人识别研究

王松孙传庆朱正平《自动化与仪器仪表》2010,(6):21-23

在应用最小分类错误（MCE）准则对识别说话人的高斯混合模型（GMM）训练中,采用一个权重函数来确定说话人模型参数调整量的权值,使得比较近的竞争说话人模型的权值大,比较远的竞争说话人模型的权值小。并采用梯度概率递减算法来实现损失函数的最小化,有效提高了说话人识别的速度和精度。相似文献

15.

基于段级特征主成分分析的说话人识别算法

储雯李银国徐洋孟祥涛《计算机应用》2013,33(7):1935-1937

为了提高说话人识别(SR)系统的运算速度,增强其鲁棒性,以现有的帧级语音特征为基础,提出了一种基于段级特征主成分分析的说话人识别算法。该算法在训练和识别阶段以段级特征代替帧级特征,然后用主成分分析方法对段级特征进行降维、去相关。实验结果表明,该算法的系统训练时间、测试时间分别为基线系统的47.8%、40.0%,同时识别率略有提高,抑制了噪声对说话人识别系统的影响。该结果验证了基于段级特征主成分分析的说话人识别算法在识别率有所提高的情况下取得了较快的识别速度,同时在不同噪声环境下的不同信噪比情况下均可以提高系统识别率。相似文献

16.

说话人识别中的串行因子分析

郭武戴礼荣王仁华《模式识别与人工智能》2009,22(4)

在基于因子分析的说话人识别中,提出串行训练载荷矩阵的方法.在载荷矩阵训练中,采用串行的方式训练得到说话人因子矩阵、对角阵(残差矩阵)和信道空间矩阵.在说话人注册中,将以上3个载荷矩阵拼接,采用联合估计的方法得到每个说话人的因子.采用这种策略可有效解决因子分析中的饱和问题.在NIST SRE 2006年核心测试数据库上等错误率能达到3.65%. 相似文献

17.

用于说话人识别的基于可变因子整合的高斯混合模型

李杰刘贺平《模式识别与人工智能》2012,25(6):937-942

针对传统高斯混合模型在噪声环境下识别率明显下降的问题,在借鉴随机概率分布模型间的α因子融合机制基础上,提出基于可变因子α整合的高斯混合模型。该模型通过引入可变因子使得混合模型中不同成分所占的比重又得到一次调整。实验结果表明,通过对该模型参数进行重估计,在TIMIT/NTIMIT两种不同语料库和不同样本集的情况下识别率较传统高斯模型均有提高。尤其在噪声环境和α因子取最优值时,识别率可提高8%,在NIST评测数据集上与GMM-UBM系统对比,识别率也有提高。相似文献

18.

基于最大似然线性回归矩阵的说话人识别算法研究

钟山何亮邓妍刘加《自动化学报》2009,35(5):546-550

研究了将自适应领域的最大似然线性回归(Maximum likelihood linear regression, MLLR)变换矩阵作为特征进行文本无关的说话人识别算法. 本文引入了基于统一背景模型的MLLRSV-SVM说话人识别算法, 并在此基础上进行高层音素聚类以进一步提高识别性能. 在采用多种信道补偿技术后, 在NIST SRE 2006年1训练语段-1测试语段同信道和跨信道数据库上, 基于MLLR特征的系统与其他最好的系统性能接近并有很强的互补性, 经过简单线性融合可以极大提高识别性能. 相似文献

19.

基于中心与圆周的英文字符识别方法研究 总被引：1，自引：0，他引：1

蓝章礼《计算机科学》2007,34(4):241-242

针对目前字符识别方法对旋转角度大的字符难以识别的问题,本文提出一种基于中心与圆周的英文字符识别方法（CCR）,通过对字符中心和适当半径圆周上的点进行分析来识别英文字符。文章通过理论分析和实验,证明了该方法能够对任意旋转角度的英文字符进行正确识别,并给出了需要进一步研究的问题。相似文献

20.

基于图注意力网络字词融合的中文命名实体识别

宋旭晖于洪涛李邵梅《计算机工程》2022,48(10):298-305

命名实体识别指识别文本中具有特定意义的实体,是自然语言处理诸多下游任务的重要基石。在命名实体识别任务中,协同图网络（CGN）模型通过引入多个图注意力网络获得较强的知识整合能力及较高的处理速度,但CGN模型在嵌入层中没有充分利用词边界信息,且采用的传统静态图注意力网络影响了图注意力的表达能力。在对CGN模型的图注意力网络进行改进的基础上,提出一种中文命名实体识别新模型,在嵌入层融入词语的分词信息,以生成包含词边界信息的字向量,从而充分利用词边界信息。通过在编码层使用BiLSTM模型获取文本的上下文信息,采用改进后的图注意力网络提取文本特征,并通过优化传统图注意力网络中相关系数的计算方式,增强模型的特征提取能力。最后,利用条件随机场对文本进行解码,从而实现对实体的标注。实验结果表明,该模型相比CGN模型在MSRA、OntoNotes4.0、Weibo数据集上的F1值分别提升了0.67%、3.16%、0.16%,验证了其在中文命名实体识别任务上的有效性。相似文献