期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

《计算机应用与软件》2017,(11)

本征音自适应是一种快速高效的自适应算法,它被广泛应用到说话人识别中,但由于同一个说话人的本征音自适应的说话人因子之间的信道特征和噪声存在差异,导致了算法的识别精度降低。针对这一问题,提出基于干扰空间投影的本征音说话人识别(EV-NSP)算法。将训练语音通过主成分分析(PCA)方法计算得到干扰投影矩阵;将投影矩阵应用到生成本征音矢量算法中;利用最大似然估计算法自适应地得到说话人因子的估计值。实验结果表明,EV-NSP算法相对于传统的本征音自适应算法识别性能有了较大的提高。相似文献

2.

特征空间本征音说话人自适应

屈丹杨绪魁张文林《自动化学报》2015,41(7):1244-1252

提出了特征空间本征音说话人自适应算法,该方法首先借鉴RATZ 算法的思想,采用高斯混合模型对特征空间中的说话人信息进行建模;其次利用子空间方法实现对特征补偿项的估计,减少估计参数的数量,在对特征空间精确建模的同时,降低了算法对自适应数据量的需求.基于微软语料库的中文连续语音识别实验表明,该算法在自适应数据量极少时仍能取得较好的性能,配合说话人自适应训练能够进一步降低词错误率,其实时性优于本征音说话人自适应算法. 相似文献

3.

一种新的基于子空间的说话人自适应方法 总被引：1，自引：0，他引：1

张文林张卫强刘加李弼程屈丹《自动化学报》2011,37(12):1495-1502

提出了一种新的基于子空间的快速说话人自适应方法.该方法在本征音(Eigen-voice, EV)自适应方法基础上,进一步在音子空间寻找低维子空间, 得到更为紧凑的“说话人--音子”联合子空间.该子空间不仅包含了说话人间的模型参数相关性信息,而且对音子间的模型参数相关性信息也进行了显式建模,在大大降低模型存储量的同时更为全面地反映模型参数的先验信息.在基于连续语音识别的无监督自适应实验中,在少量的自适应数据条件下,新方法取得了比最大似然线性回归和聚类最大似然线性基方法更好的效果. 相似文献

4.

一种空间自适应正则化图象盲复原算法 总被引：1，自引：1，他引：1

下载免费PDF全文

薛梅邹采荣杨娟杨绿溪《中国图象图形学报》2002,7(4):356-362

图象盲复原所面临的主要问题是可利用信息的不足，所以必须充分利用图象本身及成像系统的先验信息，为此，结合模糊先验辨识的思想，给出了一种新的空间自适应正则化算法，该算法先用交替最小化的迭代方法对模糊进行先验辨识，然后利用辨识结果，用各向异性扩散进行图象复原，算法充分利用了图象及成像系统（或点扩散函数PSF）的分段平滑特性，同时又利用各向异性扩散的概念，使得正则化不仅在程度上，而且在方向上都是空间自适应的，从而能够有效地进行图象盲复原，仿真结果表明，该算法的复原效果优于空间自适应各向同性正则化（SAR）算法，其收敛性能优于空间自适应各向异性正则化（SAAR）算法。相似文献

5.

PCD型自适应弹性网络在微阵列分类中的应用

李钧涛贾英民《智能系统学报》2010,5(3):227-232

针对癌症分类中的重要基因选择问题,提出了一种基于顺向坐标下降算法的自适应弹性网络.该自适应弹性网络通过引入数据驱动权重,在构建分类器的同时能自适应地成群选择基因,从而产生了一个稀疏的学习模型,增强了可解释性.此外,通过引入惩罚因子,顺向坐标下降算法被改进并有效地用于求解该自适应弹性网络.急性白血病分类实验结果验证了所提方法的有效性. 相似文献

6.

基于本征音因子分析的短时说话人识别

潘镭郭武李轶杰戴礼荣《数据采集与处理》2009,24(4)

提出了一种基于本征音因子分析的文本无关的说话人识别方法.它解决了训练语音与测试语音均很短的情况下,传统的基于最大后验概率准则的混合高斯模型无法建立稳定的说话人模型问题.首先利用期望最大化算法在开发集上训练出说话人的本征音载荷矩阵,在说话人模型建模时通过将短时语音数据向本征音空间的降维映射来得到模型参数.实验结果表明,在NIST SRE 2006数据库中的10 s训练语音-10 s测试语音任务中,在传统的混合高斯模型的基线系统上,通过采用本征音因子分析的方法可以使系统等错误率降低18%. 相似文献

7.

受昆虫复眼系统启发的图像重构算法

李敏徐立中石爱业黄凤辰《智能系统学报》2009,4(2)

虽然基于像素重排列的迭代反投影算法已经在TOMBO模型构建时提出,但是该方法需要大量的迭代次数,同时在噪声平滑效果上还有待于改进。因此一种正则化的迭代反投影算法被提出为该系统重构图像。采用自适应的总变差正则化因子和双边总变差正则化因子来正则化迭代反投影算法。自适应总变差正则化因子根据图像的当前信息来选择参数,因此用该因子正则化后的迭代反投影算法可以在平滑噪声的同时保留高频成分。而双边总变差正则化因子是依据像素点的最邻近领域和次邻近领域来判别该点是否为噪声点,考虑了更多的图像信息,从而可以跨过边缘平滑噪声。同时双边总变差正则化因子可以大大地加速重构的过程。实验是建立在仿生复眼图像上,实验结果证明了这两种正则化的迭代算法的有效性。相似文献

8.

基于压缩感知的自适应正则化磁共振图像重构 总被引：2，自引：0，他引：2

李青杨晓梅李红《计算机应用》2012,32(2):541-544

当前基于压缩传感理论的正则化磁共振(CS-MR)图像重构算法普遍采用全局正则化参数,不能很好地在保持边缘和平滑噪声方面做出平衡。为此,提出一种自适应的正则化CS-MRI重构算法。结合图像稀疏性和其局部光滑性的先验知识,采用非线性共轭梯度下降算法求取最优化问题,并在迭代过程中自适应地改变局部正则化参数。新的正则化参数可以更好地恢复图像边缘,并且有利于平滑噪声,使代价函数在定义域内具有凸性;同时先验信息包含于正则化参数中,以提高图像的高频成分。实验结果表明该算法能有效权衡恢复图像边缘和平滑噪声两者的关系。相似文献

9.

改进的弹性网模型在深度神经网络中的应用

冯明皓张天伦王林辉陈荣连少静《计算机应用》2019,39(10):2809-2814

由于具有较高的模型复杂度，深层神经网络容易产生过拟合问题，为了减少该问题对网络性能的不利影响，提出一种基于改进的弹性网模型的深度学习优化方法。首先，考虑到变量之间的相关性，对弹性网模型中的L1范数的不同变量进行自适应加权，从而得到L2范数与自适应加权的L1范数的线性组合。其次，将改进的弹性网络模型与深度学习的优化模型相结合，给出在这种新正则项约束下求解神经网络参数的过程。然后，推导出改进的弹性网模型在神经网络优化中具有群组选择能力和Oracle性质，进而从理论上保证该模型是一种更加鲁棒的正则化方法。最后，在多个回归问题和分类问题的实验中，相对于L1、L2和弹性网正则项，该方法的回归测试误差可分别平均降低87.09、88.54和47.02，分类测试准确度可分别平均提高3.98、2.92和3.58个百分点。由此，在理论和实验两方面验证了改进的弹性网模型可以有效地增强深层神经网络的泛化能力，提升优化算法的性能，解决深度学习的过拟合问题。相似文献

10.

阴影模型的正则化无设备重建与实时定位

熊一枫卢继华何梓珮曹晨曦《自动化学报》2015,41(6):1159-1165

在综合静态无线射频层析成像(Radio tomographic imaging, RTI)算法基础上, 给出了一种可行且有效的实现无线传感器节点在空旷环境和障碍物条件下无线信号衰减原理障碍物监控的方法,实现定位与追踪.利用阴影衰落模型建立接收信号强度测量值线性系统模型,并采用SPIN令牌环通信协议收集接收信号强度;创新性地引入最小角回归算法与最小绝对值收缩和选择因子算法(Least absolute shrinkage and selection operator, LASSO), 提高了图像重建速度. 即在吉洪诺夫正则化与l1正则化算法分析对比前提下,创新性引入改进的最小角回归(Least angle regression, LARS) 重建模型与算法,保证重建效果与复杂LASSO算法相似的同时,将重建图像速度提高一个数量级. 实测基于16平方米范围内的16个JENNIC 5139节点进行定位与追踪.实测结果与仿真相比虽稍有偏差,但近似符合. 这充分表明:吉洪诺夫正则化与l1正则化适用于不同分辨率场景,且都可较好地反映障碍物状况. 相似文献

11.

Embedded kernel eigenvoice speaker adaptation and its implication to reference speaker weighting

Brian Kan-Wing Mak Roger Wend-Huu Hsiao Simon Ka-Lung Ho Kwok J.T. 《IEEE transactions on audio, speech, and language processing》2006,14(4):1267-1280

Recently, we proposed an improvement to the conventional eigenvoice (EV) speaker adaptation using kernel methods. In our novel kernel eigenvoice (KEV) speaker adaptation, speaker supervectors are mapped to a kernel-induced high dimensional feature space, where eigenvoices are computed using kernel principal component analysis. A new speaker model is then constructed as a linear combination of the leading eigenvoices in the kernel-induced feature space. KEV adaptation was shown to outperform EV, MAP, and MLLR adaptation in a TIDIGITS task with less than 10 s of adaptation speech. Nonetheless, due to many kernel evaluations, both adaptation and subsequent recognition in KEV adaptation are considerably slower than conventional EV adaptation. In this paper, we solve the efficiency problem and eliminate all kernel evaluations involving adaptation or testing observations by finding an approximate pre-image of the implicit adapted model found by KEV adaptation in the feature space; we call our new method embedded kernel eigenvoice (eKEV) adaptation. eKEV adaptation is faster than KEV adaptation, and subsequent recognition runs as fast as normal HMM decoding. eKEV adaptation makes use of multidimensional scaling technique so that the resulting adapted model lies in the span of a subset of carefully chosen training speakers. It is related to the reference speaker weighting (RSW) adaptation method that is based on speaker clustering. Our experimental results on Wall Street Journal show that eKEV adaptation continues to outperform EV, MAP, MLLR, and the original RSW method. However, by adopting the way we choose the subset of reference speakers for eKEV adaptation, we may also improve RSW adaptation so that it performs as well as our eKEV adaptation. 相似文献

12.

Maximum Penalized Likelihood Kernel Regression for Fast Adaptation

Mak B.K.-W. Tsz-Chung Lai Tsang I.W. Kwok J.T.-Y. 《IEEE transactions on audio, speech, and language processing》2009,17(7):1372-1381

This paper proposes a nonlinear generalization of the popular maximum-likelihood linear regression (MLLR) adaptation algorithm using kernel methods. The proposed method, called maximum penalized likelihood kernel regression adaptation (MPLKR), applies kernel regression with appropriate regularization to determine the affine model transform in a kernel-induced high-dimensional feature space. Although this is not the first attempt of applying kernel methods to conventional linear adaptation algorithms, unlike most of other kernelized adaptation methods such as kernel eigenvoice or kernel eigen-MLLR, MPLKR has the advantage that it is a convex optimization and its solution is always guaranteed to be globally optimal. In fact, the adapted Gaussian means can be obtained analytically by simply solving a system of linear equations. From the Bayesian perspective, MPLKR can also be considered as the kernel version of maximum a posteriori linear regression (MAPLR) adaptation. Supervised and unsupervised speaker adaptation using MPLKR were evaluated on the Resource Management and Wall Street Journal 5K tasks, respectively, achieving a word error rate reduction of 23.6% and 15.5% respectively over the speaker-independently model. 相似文献

13.

p范数正则化支持向量机分类算法 总被引：6，自引：3，他引：3

刘建伟李双成罗雄麟《自动化学报》2012,38(1):76-87

L2范数罚支持向量机(Support vector machine,SVM)是目前使用最广泛的分类器算法之一,同时实现特征选择和分类器构造的L1范数和L0范数罚SVM算法也已经提出.但是,这两个方法中,正则化阶次都是事先给定,预设p=2或p=1.而我们的实验研究显示,对于不同的数据,使用不同的正则化阶次,可以改进分类算法的预测准确率.本文提出p范数正则化SVM分类器算法设计新模式,正则化范数的阶次p可取范围为02范数罚SVM,L1范数罚SVM和L0范数罚SVM. 相似文献

14.

基于minmaxKKT条件的三维重构方法 总被引：1，自引：0，他引：1

周果清王庆《自动化学报》2012,38(9):1439-1444

机器视觉中, 三维重构是一个重要问题. 基于2范数的最小二乘法速度较快, 但因误差代价函数非凸, 理论上无法获得全局最优解, 即使通过分支限界等方法, 往往也只能获得局部最优. 无穷范数表示的误差代价函数理论上可以获得全局最优, 但是计算速度很慢. 本文提出一种基于最小最大库恩塔克条件(minmaxKKT)的三维重构方法. 该方法利用minmaxKKT条件对基于2范数的三维重构结果进行全局最优判别, 对陷入局部最优的结果运用混合最速下降法进行全局寻优. 该方法可以获得全局最优, 相对于无穷范数算法具有更高的计算效率. 对标准数据集和真实数据的实验结果证明了本文算法的可行性和优点. 相似文献

15.

An antinoise sparse representation method for robust face recognition via joint l1 and l2 regularization

《Expert systems with applications》2017

Sparse representation methods based on l₁ and/or l₂ regularization have shown promising performance in different applications. Previous studies show that the l₁ regularization based representation has more sparse property, while the l₂ regularization based representation is much simpler and faster. However, when dealing with noisy data, both naive l₁ and l₂ regularization suffer from the issue of unsatisfactory robustness. In this paper, we explore the method to implement an antinoise sparse representation method for robust face recognition based on a joint version of l₁ and l₂ regularization. The contributions of this paper are mainly shown in the following aspects. First, a novel objective function combining both l₁ and l₂ regularization is proposed to implement an antinoise sparse representation. An iterative fitting operation via l₁ regularization is integrated with l₂ norm minimization, to obtain an antinoise classification. Second, the rationale how the proposed method produces promising discriminative and antinoise performance for face recognition is analyzed. The l₂ regularization enhances robustness and runs fast, and l₁ regularization helps cope with the noisy data. Third, the classification robustness of the proposed method is demonstrated by extensive experiments on several benchmark facial datasets. The method can be considered as an option for the expert systems for biometrics and other recognition problems facing unstable and noisy data. 相似文献

16.

弹性网络核极限学习机的多标记学习算法

下载免费PDF全文

王一宾裴根生程玉胜《智能系统学报》2019,14(4):831-842

将正则化极限学习机或者核极限学习机理论应用到多标记分类中,一定程度上提高了算法的稳定性。但目前这些算法关于损失函数添加的正则项都基于L2正则,导致模型缺乏稀疏性表达。同时,弹性网络正则化既保证模型鲁棒性且兼具模型稀疏化学习,但结合弹性网络的极限学习机如何解决多标记问题鲜有研究。基于此,本文提出一种对核极限学习机添加弹性网络正则化的多标记学习算法。首先,对多标记数据特征空间使用径向基核函数映射;随后,对核极限学习机损失函数施加弹性网络正则项;最后,采用坐标下降法迭代求解输出权值以得到最终预测标记。通过对比试验和统计分析表明,提出的算法具有更好的性能表现。相似文献

17.

一类非线性系统的H₂容错控制器的设计及其在空间飞行器的应用

刘春生姜斌《自动化学报》2013,39(2):188-196

针对存在执行器故障的不确定系统,本文研究了一种H2鲁棒容错控制的设计.控制器包括三个功能: 1)利用径向基函数(Radial basis function, RBF)神经网络估计得到的近似非线性函数构成闭环控制,抵消系统的非线性特征; 2)能实现H2性能指标的最优控制; 3)利用滑模控制抑制模型估计误差以提高控制精度, 并且控制器具有指定稳定裕度的设计功能.文中提出了用于执行器故障估计的调整规则, 故障估计信息用于控制律的设计.基于Lyapunov函数,推导了满足H2最优性能的充分条件:非线性二次矩阵不等式. 为了降低计算成本,给出了不等式求解的简化算法,避免了在线求解非线性矩阵不等式.通过一个空间飞行器模型的仿真, 验证了本文提出方法的有效性. 相似文献

18.

说话人识别中的因子分析以及空间拼接 总被引：1，自引：0，他引：1

郭武李轶杰戴礼荣王仁华《自动化学报》2009,35(9):1193-1198

联合因子分析可以有效拟合混合高斯模型中的说话人和信道差异, 在说话人识别中得到广泛应用. 一般情况下, 该算法在对说话人和信道两个载荷矩阵进行联合估计时, 说话人残差矩阵无法发挥作用, 信道载荷矩阵的因子数不能提高. 本文提出说话人载荷矩阵、说话人残差载荷矩阵采用串行的训练模式, 在信道载荷矩阵训练中采用矩阵拼接的方法, 能够有效提高识别率; 在NIST SRE 2008年核心测试数据库的五个部分分别达到等错误率3.3%, 5.1%, 5.0%, 5.3%和5.0%. 相似文献

19.

特殊权限下权重不同参与者的广义门限方案 总被引：1，自引：0，他引：1

下载免费PDF全文

张艳硕刘卓军杜耀刚《计算机工程与应用》2007,43(17):15-17

在秘密共享案中,一般集中于（n,t）门限秘密共享方案的研究。文中给出的是具有特殊权限的参与者权重不同的（m+n₁+n₂+…+n_l,t+1+1+…+1）门限秘密共享方案和（m+n₁+…+n_l,t+t₁+…+t_l）门限秘密共享方案,它们是（m+n,t+1）门限秘密共享方案的推广形式。基于中国剩余定理分别给出具有特殊权限的且参与者具有不同权重的（m+n₁+n₂+…+n_l,t+1+1+…+1）门限秘密共享方案和（m+n₁+…+n_l,t+t₁+…+t_l）门限秘密共享方案。相似文献