期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

储雯李银国徐洋孟祥涛《计算机应用》2013,33(7):1935-1937

为了提高说话人识别(SR)系统的运算速度,增强其鲁棒性,以现有的帧级语音特征为基础,提出了一种基于段级特征主成分分析的说话人识别算法。该算法在训练和识别阶段以段级特征代替帧级特征,然后用主成分分析方法对段级特征进行降维、去相关。实验结果表明,该算法的系统训练时间、测试时间分别为基线系统的47.8%、40.0%,同时识别率略有提高,抑制了噪声对说话人识别系统的影响。该结果验证了基于段级特征主成分分析的说话人识别算法在识别率有所提高的情况下取得了较快的识别速度,同时在不同噪声环境下的不同信噪比情况下均可以提高系统识别率。相似文献

2.

基于段级特征的对话环境下说话人分段算法

王波徐毅琼李弼程《计算机工程与设计》2007,28(10):2401-2402,2416

提出了一种使用段级语音特征对测试进行说话人分段从而实现对话环境下说话人分段算法,算法实现中基于车比雪夫和不等式提出了基于协方差模型的段级特征的距离测度描述.该识别方法根据实验选择了合适的段级特征语音段长度,实验结果表明基于段级特征的说话人识别方法在有效地在对话环境下将多人的语音进行分段,从而提高了说话人识别系统的精度和识别速度. 相似文献

3.

一种基于PCA和ReliefF的特征选择方法 总被引：4，自引：0，他引：4

下载免费PDF全文

蒋玉娇王晓丹王文军毕凯《计算机工程与应用》2010,46(26):170-172

如何减少样本的训练测试时间、提高分类精度是有效特征选择方法研究的重要方面。提出了一种结合PCA和ReliefF的特征选择算法。该算法选择出了最具有代表性的特征,构成有效特征子集,实现了特征降维。同时,较PCA-GA方法,该算法具有简单、快速等优点。利用标准数据集进行的实验结果表明,文中算法是可行的、有效的,为模式识别的信息特征压缩提供了一种新的研究方法。相似文献

4.

一种自适应权值的PCA算法 总被引：2，自引：0，他引：2

下载免费PDF全文

杨开睿孟凡荣梁志贞《计算机工程与应用》2012,48(3):189-191

针对传统PCA方法对离群点鲁棒性差的问题,提出了一种具有更高鲁棒性且自适应权值的PCA方法。在PCA方法的基础上建立了一个加权的重建误差和最小模型,通过引入信息熵来调节重建误差的权值;通过交替优化算法迭代求解模型。在Yale人脸库和UCI数据集上的实验表明该方法具有很好的鲁棒性和识别率。相似文献

5.

一种基于PCA的文本特征混合选择方法

张扬武李国和王立梅宗恒赵晶明《计算机应用与软件》2019,36(10)

由于文本分类中的特征空间高维稀疏,传统单一的降维方法难以满足实际大数据分类需求。针对这种情况,提出一种两阶段的混合特征选择方法。第一阶段计算每个特征词的信息增益率并进行排序,然后根据设定的阈值进行特征词的选择。第二阶段利用主成分分析方法将第一阶段输出的仍保持高维特性的高维特征空间映射到低维新特征空间。实验结果表明,与单一的传统方法比较,混合特征选择方法实现了二次降维,不但减少了计算开销,还提高了分类性能。相似文献

6.

一种改进的模块PCA人脸识别新方法 总被引：2，自引：0，他引：2

下载免费PDF全文

张岩武玉强《计算机工程与应用》2011,47(26):216-218

提出了一种改进的模块PCA方法,即基于独立特征抽取的模块PCA方法。算法先对图像进行分块,然后对每一子块独立地进行PCA处理,求出测试样本子块与训练样本对应子块间的距离;最后将这些距离相加得到测试样本与训练样本的距离,用最近距离分类器分类。在ORL人脸库和Yale人脸库上的实验结果表明,提出的方法在识别性能上明显优于普通模块PCA方法。相似文献

7.

基于PCA特征和融合特征的ECG身份识别方法

杨向林严洪任兆瑞宋晋忠姚宇华李延军《智能系统学报》2010,5(5):458-463

ECG作为一种活体生物特征用于身份识别在国际上引起了广泛重视.针对基于解析特征的ECG身份识别方法对特征点检测精度要求较高的缺点,提出一种仅需R波峰值点检测的ECG身份识别方法,该方法通过有针对性的设定相应阈值,将PCA特征和小波融合特征方法相结合.实验结果表明该方法优于PCA特征方法、波形特征方法和小波特征方法,既减少了特征点检测的复杂性和特征点检测不准确带来的误差,又可获得较高的识别率,是一种实时、高效算法. 相似文献

8.

基于CCA和PCA的说话人特征降维研究

陈觉之张贵荣周宇欢《计算机与现代化》2013,(6):16-19

为提高说话人识别的性能,提出将CCA与PCA联合用于说话人特征降维的方法:先用CCA融合基于声道模型的LPC特征和基于听觉模型的MFCC特征,提升这两类不同特征的相关性;然后用PCA进一步去除冗余特征,降低有效特征的维数。实验显示,这两种降维方法联合的降维效果与单一的CCA降维、PCA降维或手动降维的效果比有明显提高。相似文献

9.

面向非特定人语音情感识别的PCA特征选择方法

罗宪华杨大利徐明星徐露《计算机科学》2011,38(8):212-213,256

在语音情感识别中,如何选取有效的情感特征是识别过程的重要环节。迄今为止,一些常用的特征选择算法虽然能够帮助提高识别性能,但也存在理论性不强、随机性高、计算量大的缺点。因此提出了一种基于主成分分析(PCA)的特征选择方法,亦即对原始特征集合先进行PCA变换,再利用变换矩阵分析出原始特征进行变换时各自的权重,最后根据权重的大小对原始特征进行选择。实验结果表明,选择出的特征对识别率具有较大的贡献,属于重要特征。相似文献

10.

基于混合PCA和KFD的多级说话人确认

下载免费PDF全文

邢玉娟张成文李明《计算机工程》2010,36(18):185-187

提出一种基于混合主成分分析(PCA)分类器和核Fisher判别(KFD)的多级说话人确认方法。利用PCA对注册说话人的特征向量进行降维,根据转换矩阵得到说话人特征向量的主成分空间和截断误差空间,结合这2个空间构造混合PCA分类器,用于快速判断最有可能的R个目标说话人,并采用KFD寻找最终目标说话人。仿真实验结果验证了该方法的有效性。相似文献

11.

基于多特征i-vector的短语音说话人识别算法

孙念张毅林海波黄超《计算机应用》2018,38(10):2839-2843

当测试语音时长充足时,单一特征的信息量和区分性足够完成说话人识别任务,但是在测试语音很短的情况下,语音信号里缺乏充分的说话人信息,使得说话人识别性能急剧下降。针对短语音条件下的说话人信息不足的问题,提出一种基于多特征i-vector的短语音说话人识别算法。该算法首先提取不同的声学特征向量组合成一个高维特征向量,然后利用主成分分析（PCA）去除高维特征向量的相关性,使特征之间正交化,最后采用线性判别分析（LDA）挑选出最具区分性的特征,并且在一定程度上降低空间维度,从而实现更好的说话人识别性能。结合TIMIT语料库进行实验,同一时长的短语音（2 s）条件下,所提算法比基于i-vector的单一的梅尔频率倒谱系数（MFCC）、线性预测倒谱系数（LPCC）、感知对数面积比系数（PLAR）特征系统在等错误率（EER）上分别有相对72.16%、69.47%和73.62%的下降。不同时长的短语音条件下,所提算法比基于i-vector的单一特征系统在EER和检测代价函数（DCF）上大致都有50%的降低。基于以上两种实验的结果充分表明了所提算法在短语音说话人识别系统中可以充分提取说话人的个性信息,有利地提高说话人识别性能。相似文献

12.

基于特征融合的多模态身份识别方法研究

林玲周新民商琳高阳《计算机工程与设计》2011,32(8):2849-2852

研究了多模态身份识别问题,结合人脸和掌纹两种不同生理特征,提出了基于特征融合的多模态身份识别方法。对人脸和掌纹图像分别进行Gabor小波、二维主元变换(2DPCA)提取图像特征,根据新的权重算法,结合两种模态的特征,利用最邻近分类器进行分类识别。在AMP、ORL人脸库和Poly-U掌纹图像库中的实验结果表明,两种模态的融合能更多地给出决策分析所需的特征信息相比传统的单一模态的人脸或掌纹识别具有较高的识别率,更具安全性和准确性。相似文献

13.

噪声环境下话者识别系统的特征提取

WANG Lei 《数字社区&智能家居》2008,(22)

重点研究在噪声环境下,话者识别中语音信号的特征提取。将能减化信号,消除较小分量而保留信号的基本特征的数学形态滤波器良好的滤波性应用在一维语音信号的处理中。并在噪声环境下,应用线性预测的MFCC特征提取方法提高鲁棒性。提取几种重要的语音特征参数,包括线性预测倒谱系数、MEL倒谱系数、语音动态参数、激励源特征等,对这些参数进行分析和比较,以达到话者识别的目的。相似文献

14.

噪声环境下话者识别系统的特征提取

王蕾《数字社区&智能家居》2008,(8):784-785

重点研究在噪声环境下,话者识别中语音信号的特征提取。将能减化信号,消除较小分量而保留信号的基本特征的数学形态滤波器良好的滤波性应用在一维语音信号的处理中。并在噪声环境下,应用线性预测的MFCC特征提取方法提高鲁棒性。提取几种重要的语音特征参数,包括线性预测倒谱系数、MEL倒谱系数、语音动态参数、激励源特征等,对这些参数进行分析和比较．以达到话者识别的目的。相似文献

15.

Mismatched feature detection with finer granularity for emotional speaker recognition

Li Chen Ying-chun Yang Zhao-hui Wu 《浙江大学学报:C卷英文版》2014,15(10):903-916

The shapes of speakers＇ vocal organs change under their different emotional states, which leads to the deviation of the emotional acoustic space of short-time features from the neutral acoustic space and thereby the degradation of the speaker recognition performance. Features deviating greatly from the neutral acoustic space are considered as mismatched features, and they negatively affect speaker recognition systems. Emotion variation produces different feature deformations for different phonemes, so it is reasonable to build a finer model to detect mismatched features under each phoneme. However, given the difficulty of phoneme recognition, three sorts of acoustic class recognition--phoneme classes, Gaussian mixture model （GMM） tokenizer, and probabilistic GMM tokenizer--are proposed to replace phoneme recognition. We propose feature pruning and feature regulation methods to process the mismatched features to improve speaker recognition performance. As for the feature regulation method, a strategy of maximizing the between-class distance and minimizing the within-class distance is adopted to train the transformation matrix to regulate the mismatched features. Experiments conducted on the Mandarin affective speech corpus （MASC） show that our feature pruning and feature regulation methods increase the identification rate （IR） by 3.64% and 6.77%, compared with the baseline GMM-UBM （universal background model） algorithm. Also, corresponding IR increases of 2.09% and 3.32% can be obtained with our methods when applied to the state-of-the-art algorithm i-vector. 相似文献

16.

新的基于特征关系表述的步态识别算法

项俊笪邦友梁娟侯建华《计算机应用》2012,32(3):885-888

为了快速有效地进行步态识别,利用特征关系非平稳分布的统计特性,提出了一种新的基于特征关系表述的步态识别算法。首先,将剪影轮廓相邻像素点间8邻域相对方向标号作为特征关系属性一,将轮廓边界点与中心点间的距离作为特征关系属性二,经直方图归一化处理,得到两种关系属性的联合概率;其次,结合主成分分析(PCA)降维的方法,提取特征主向量;最后,采用最近邻分类器进行识别分类。实验证明,该算法在CASIA步态数据库上,最高达到了90%以上的识别率,而且与传统的特征关系表述步态识别算法相比,关系属性联合概率矩阵维数由900维下降到240维,大大降低了算法的计算代价。相似文献

17.

短语音噪声环境下说话人识别特征提取

高会贤马全福郑晓势《计算机应用》2010,30(10):2712-2714

为了使说话人识别系统在语音较短和存在噪声的环境下也具有较高的识别率,基于矢量量化识别算法,对提取的特征参数进行研究。把小波变换与美尔频率倒谱系数(MFCC)的提取相结合,并将改进后的特征与谱质心特征进行了组合,建立了一种美尔频率小波变换系数+谱质心(MFWTC+SC)的新的组合特征参数。经实验表明,该组合特征可以有效地提高说话人识别系统的性能。相似文献

18.

Text-Independent Speaker Verification for Real Fast-Varying Noisy Environments

Todor Ganchev Ilyas Potamitis Nikos Fakotakis George Kokkinakis 《International Journal of Speech Technology》2004,7(4):281-292

Investigating Speaker Verification in real-world noisy environments, a novel feature extraction process suitable for suppression of time-varying noise is compared with a fine-tuned spectral subtraction method. The proposed feature extraction process is based on approximating the clean speech and the noise spectral magnitude with a mixture of Gaussian probability density functions (pdfs) by using the Expectation-Maximization algorithm (EM). Subsequently, the Bayesian inference framework is applied to the degraded spectral coefficients, and by employing Minimum Mean Square Error Estimation (MMSE), a closed form solution for the spectral magnitude estimation task is derived. The estimated spectral magnitude finally is incorporated into the Mel-Frequency Cepstral Coefficients (MFCCs) front-end of a baseline text-independent speaker verification system, based on Probabilistic Neural Networks, which participated successfully in the 2002 NIST (National Institute of Standards and Technology of USA) Speaker Recognition Evaluation. A comparative study of the proposed technique for real-world noise types demonstrates a significant performance gain compared to the baseline speech features and to the spectral subtraction enhancement method. Improvements of the absolute speaker verification performance with more than 27% for 0 dB signal-to-noise ratio (SNR), compared to the MFCCs, and with more than 13% for –5 dB SNR, compared to the spectral subtraction version, were obtained in the case of a passing-by aircraft scenario. 相似文献