期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

张俊关胜晓《计算机应用》2015,35(7):2101-2104

针对目前说话人识别系统的效率问题,采用集成算法的策略,提出一种新的说话人识别系统框架。首先,考虑到传统的最大后验概率矢量量化(VQ-MAP)算法中只关注平均矢量而不考虑权重的问题,提出了改进的VQ-MAP算法,使用加权平均向量来代替平均向量;然后,由于支持向量机(SVM)算法相对耗时,故采用最小二乘支持向量机(LS-SVM)替代SVM算法;最后,在说话人识别系统中,利用改进的VQ-MAP算法所得参数集作为LS-SVM的训练样本。实验结果表明,基于改进的VQ-MAP和LS-SVM的集成算法,与传统的SVM算法相比,在均使用径向基函数(RBF)核函数时,对40人样本数据建模时间上减少接近40%;在阈值为1,测试语音时长为4 s时,与传统的VQ-MAP和SVM算法相比,误识率降低了1.1%,误拒率降低了2.9%,识别率提高了3.9%;在阈值为1,测试语音时长为4 s时,与传统的VQ-MAP和LS-SVM算法相比,误识率降低了3.6%,误拒率降低了2.7%,识别率提高了4.4%。结果表明,集成算法能够有效提高算法识别率,明显减少运算时间,同时降低误识率和误拒率。相似文献

2.

基于VQ-MAP和SVM融合的说话人识别系统

下载免费PDF全文

展领景新幸《计算机工程与应用》2011,47(13):136-138

针对传统支持向量机（SVM）在说话人识别中运算量过大的问题,提出了VQ-MAP和SVM融合的说话人识别系统。它应用仅自适应均值向量的最大后验概率矢量量化过程（VQ-MAP）,来得到自适应的说话人模型,用此模型中的参数向量作为支持向量应用于SVM来进行说话人识别。用Matlab进行仿真实验,结果表明,基于VQ-MAP和SVM融合的说话人识别系统大大降低了运算量,SVM训练时间短,且具有较高的识别率。相似文献

3.

基于最小二乘支持向量机的短期电力负荷预测

曹彦王倩周驰《电脑开发与应用》2013,(3):38-41

提出了结合遗传算法(Genetic Algorithm,GA)和最小二乘支持向量机(Least Squares Support Vector Machines,LS-SVM)的短期电力负荷预测。由于影响负荷预测因素的复杂性和最小二乘支持向量机参数选择的不确定性,提出了采用遗传算法同时对电力负荷训练样本进行特征提取和最小二乘支持向量机的参数选择,然后利用提取出的数据序列和选择的参数,建立最小二乘支持向量机预测模型。通过实际算例分析,证明了该算法可以改善预测模型的精度和泛化能力。相似文献

4.

最小二乘向量机在说话人识别中的应用

但志平郑胜《微机发展》2007,17(5):30-32

说话人识别是语音识别的一种,是当前的研究热点之一。而基于统计学习理论的支持向量机(SVM)方法是一种新的机器学习算法,已成为机器学习研究的热点。讨论了一种改进的SVM即最小二乘向量机(LS-SVM)的方法进行说话人识别研究。研究表明,基于LS-SVM的说话人识别比传统的SVM说话人识别计算复杂度小、效率更高、对说话人识别有很强的适应性。相似文献

5.

用SVM和LS-SVM分析变压器故障诊断

张哲朱永利《微型机与应用》2009,28(8)

介绍并比较了支持向量机分类器和最小二乘支持向量机分类器的算法,提出了基于支持向量机的二叉树多分类变压器故障诊断模型.将标准支持向量机(C-SVM)分类器和最小二乘支持向量机(LS-SVM)分类器分别用于变压器故障诊断,通过网格搜索和交叉验证法取得支持向量机的参数,准确率较高.试验结果表明,支持向量机和最小二乘支持向量机在变压器故障诊断中具有很大的应用潜力. 相似文献

6.

基于支持向量机和最小二乘支持向量机的入侵检测比较 总被引：2，自引：0，他引：2

任勋益王汝传谢永娟《计算机科学》2008,35(10):83-85

将支持向量机和最小二乘支持向量机用于入侵检测之中,利用主元分析对数据进行约简,然后使用SVM和 LS-SVM对数据进行训练和测试.基于KDDCUP'99做了三组对比实验,对支持向量机和最小二乘支持向量机的性能做了统计.实验结果表明,SVM比LS-SVM分类能力强,但是LS-SVM耗时较少. 相似文献

7.

基于LSSVM的VVP推力系数预报

郑秀丽刘胜李冰《控制工程》2011,18(4):584-587

针对神经网络存在结构较难确定、训练易陷入局部最优以及容易过学习等问题和标准SVM训练速度较慢等问题,提出最小二乘支持向量机算法,最小二乘支持向量机算法(LS-SVM)具有比其他非线性函数逼近方法具有更强的泛化能力;并且LS-SVM采用径向基核函数,得到LSSVM模型的待定参数比标准支持向量机少,仅为2个.将最小二乘支持... 相似文献

8.

基于压缩感知的多尺度最小二乘支持向量机

王琴沈远彤《自动化学报》2016,42(4):631-640

提出一种基于压缩感知(Compressive sensing, CS)和多分辨分析(Multi-resolution analysis, MRA)的多尺度最小二乘支持向量机(Least squares support vector machine, LS-SVM). 首先将多尺度小波函数作为支持向量核, 推导出多尺度最小二乘支持向量机模型, 然后基于压缩感知理论, 利用最小二乘匹配追踪(Least squares orthogonal matching pursuit, LS-OMP)算法对多尺度最小二乘支持向量机的支持向量进行稀疏化, 最后用稀疏的支持向量实现函数回归. 实验结果表明, 本文方法利用不同尺度小波核逼近信号的不同细节, 而且以比较少的支持向量能达到很好的泛化性能, 大大降低了运算成本, 相比普通最小二乘支持向量机, 具有更优越的表现力. 相似文献

9.

最小二乘支持向量机与Kalman滤波耦合的瓦斯涌出量动态预测模型

付华訾海《计算机应用》2015,35(1):289-293

针对瓦斯涌出量的多影响因素预测问题,提出一种最小二乘支持向量机(LS-SVM)回归算法与卡尔曼滤波耦合的动态预测方法.该方法依据预测残差方差比检验策略确定自适应的动态训练样本集以取代固定的训练样本集.LS-SVM辨识网络对瓦斯涌出量的相关因素进行非线性映射并提取出最佳维数的状态向量以建立基于卡尔曼滤波最优估计的瓦斯涌出量预测模型.利用矿井监测到的各项历史数据进行实验.结果表明,该模型的预测平均相对误差为2.17%,平均相对变动值ARV为0.008873,相比单一的神经网络或支持向量机预测模型,具有更高的预测精度与更强的泛化能力. 相似文献

10.

基于贝叶斯框架的加权LS-SVM及其学习算法

梁筱斌罗飞许玉格周辉《微计算机信息》2009,25(18)

为了提高最小二乘支持向量机的鲁棒性,介绍了加权最小二乘支持向量机,给出了确定加权向量的一般方法.并介绍了基于贝叶斯框架的加权LS-SVM参数的优化方法,利用它建立了加权最小二乘支持向量机.最后用一个仿真实例来说明所提出的支持向量机的学习性能,比标准LS-SVM具有更好的鲁棒性. 相似文献

11.

基于多码本矢量量化的非限定文本的联机话者辨认方法

马继涌高文姚鸿勋《计算机研究与发展》1999,36(6):712-716

传统的利用话者的一个时期的语音作为训练语音,进行话者码本训练的方法,识别系统往往不够稳定．为了适应话者自身语音的时变性,文中提出了利用话者不同时期的语音进行训练话者的模型,每个话者具有多个码本．这些码本是采用逐渐减小误识率的优化过程得到的．为了补偿不同信道对系统识别性能的影响,文中给出了一种信道补偿方法．同时提出以一帧高能的浊音语音特征代替一个浊音音素的特征,实现了在线浊音特征提取,利用两级矢量量化及码本索引策略减少了４４％的识别计算量．这些方法大大增加了系统的识别速度和鲁棒性．文中比较了用ＰＬＰ分析和ＬＰＣ倒谱分析进行话者辨认的识别结果．相似文献

12.

A study on speaker identification based on weighted LS-SVM

Hui Ding Zhen-Min Tang Li-Hua Wei Yan-Ping Li 《Automatic Control and Computer Sciences》2009,43(6):328-335

As one of a practical method, least squares support vector machine (LS-SVM) is usable for nonlinear separable problem as speaker identification. However, single LS-SVM can only do such classifying as binary classification, so it always needs multiple LS-SVMs and corresponding algorithms for classifying multiple speakers in a speaker identification database. By comparing pairwise LS-SVM with one-against-all LS-SVM, it is obvious that the pairwise LS-SVM has the advantage of facilitative expanding for different cases, while the one-against-all LS-SVM can not bring. However conventional pairwise LS-SVM needs too many judgment times to do multi-classing. In order to improve the pairwise LS-SVM and make it applicable to multi-speaker identification system, we propose a new notion of classification weight for pairwise LS-SVM and the corresponding algorithm, named as pairwise LS-SVM based on classification weight, i.e., the m-ωLS-SVM method, which can be used in multi-speaker identification system. Experiment results show that, comparing with conventional pairwise LS-SVM, the identification speed of the system with m-ωLS-SVM method is improved while keeping correct rate of identification, or vice versa, with only a little increase of training time. 相似文献

13.

Discriminative speaker recognition using large margin GMM

Reda Jourani Khalid Daoudi Régine André-Obrecht Driss Aboutajdine 《Neural computing & applications》2013,22(7-8):1329-1336

Most state-of-the-art speaker recognition systems are based on discriminative learning approaches. On the other hand, generative Gaussian mixture models (GMM) have been widely used in speaker recognition during the last decades. In an earlier work, we proposed an algorithm for discriminative training of GMM with diagonal covariances under a large margin criterion. In this paper, we propose an improvement of this algorithm, which has the major advantage of being computationally highly efficient, thus well suited to handle large-scale databases. We also develop a new strategy to detect and handle the outliers that occur in the training data. To evaluate the performances of our new algorithm, we carry out full NIST speaker identification and verification tasks using NIST-SRE’2006 data, in a Symmetrical Factor Analysis compensation scheme. The results show that our system significantly outperforms the traditional discriminative support vector machines (SVM)-based system of SVM-GMM supervectors, in the two speaker recognition tasks. 相似文献

14.

基于MAP+CMLLR的说话人识别中发声力度问题

黄文娜彭亚雄贺松《计算机应用》2017,37(3):906-910

为了改善发声力度对说话人识别系统性能的影响,在训练语音存在少量耳语、高喊语音数据的前提下,提出了使用最大后验概率（MAP）和约束最大似然线性回归（CMLLR）相结合的方法来更新说话人模型、投影转换说话人特征。其中,MAP自适应方法用于对正常语音训练的说话人模型进行更新,而CMLLR特征空间投影方法则用来投影转换耳语、高喊测试语音的特征,从而改善训练语音与测试语音的失配问题。实验结果显示,采用MAP+CMLLR方法时,说话人识别系统等错误率（EER）明显降低,与基线系统、最大后验概率（MAP）自适应方法、最大似然线性回归（MLLR）模型投影方法和约束最大似然线性回归（CMLLR）特征空间投影方法相比,MAP+CMLLR方法的平均等错率分别降低了75.3%、3.5%、72%和70.9%。实验结果表明,所提出方法削弱了发声力度对说话人区分性的影响,使说话人识别系统对于发声力度变化更加鲁棒。相似文献

15.

MFCC-GMM based accent recognition system for Telugu speech signals

Kasiprasad Mannepalli Panyam Narahari Sastry Maloji Suman 《International Journal of Speech Technology》2016,19(1):87-93

Speech processing is very important research area where speaker recognition, speech synthesis, speech codec, speech noise reduction are some of the research areas. Many of the languages have different speaking styles called accents or dialects. Identification of the accent before the speech recognition can improve performance of the speech recognition systems. If the number of accents is more in a language, the accent recognition becomes crucial. Telugu is an Indian language which is widely spoken in Southern part of India. Telugu language has different accents. The main accents are coastal Andhra, Telangana, and Rayalaseema. In this present work the samples of speeches are collected from the native speakers of different accents of Telugu language for both training and testing. In this work, Mel frequency cepstral coefficients (MFCC) features are extracted for each speech of both training and test samples. In the next step Gaussian mixture model (GMM) is used for classification of the speech based on accent. The overall efficiency of the proposed system to recognize the speaker, about the region he belongs, based on accent is 91 %. 相似文献

16.

说话人识别中基于聚类特征的矢量量化技术

徐利敏唐振民何可可钱博《计算机工程与应用》2007,43(27):196-198

为解决采用矢量量化的方法进行说话人识别时出现的失真问题,根据汉语语音的发音特性,提出了将矢量量化与语音特征的聚类技术相结合的方法,在进行矢量量化码书训练之前,先对特征矢量进行聚类筛选。实验结果表明,当测试语音片段长度为4 s时,在保持95％左右识别率下,采用普通矢量量化方法需64码本数,而采用该文方法只需8码本数,降低了8倍。结果说明该方法不但在一定程度上解决了因训练样本不足而引起的失真问题,而且通过方法的改进,实现了采用较低码字数产生较好的识别结果,从而提高识别效率。相似文献

17.

基于DNN与基音周期的说话人识别

张学祥雷菊阳《计算机与现代化》2020,(1):122-126

传统说话人识别框架大多建立在高斯混合模型（GMM）上的,然而这种浅层学习模型不能有效地表征数据特征之间的高阶相关性,识别效果较差。本文提出一种基于深度神经网络（Deep Neural Network, DNN）与基音周期（Pitch Period, PP）相结合的说话人识别方法,模型主线识别以对数梅尔滤波器组特征参数作为DNN的输入,通过训练DNN模型提取说话人的声纹特征;针对DNN模型阈值设定人的主观性影响,利用动态时间规整技术匹配说话人基音周期进行辅助识别。实验结果表明,这种双重识别方法等错误率可以达到1.6%,较DNN系统与EM-GMM系统等错误率分别降低了1.2%和2.4%,并且在噪声环境中仍具有较好的鲁棒性。相似文献