首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 218 毫秒
1.
该文提出一种基于低秩约束的本征音子(Eigenphone)说话人自适应方法。原始的本征音子说话人自适应方法在自适应语料充分时具有很好的效果,然而当自适应语料不足时,出现严重的过拟合现象,导致自适应后的系统可能比自适应前的系统还要差。首先,对协方差矩阵为对角阵的隐马尔可夫-高斯混合模型语音识别系统,推导出一种简化的本征音子矩阵估计算法;然后,对本征音子矩阵引入低秩约束,采用矩阵的核范数作为矩阵秩的凸近似,通过调节核范数的权重因子以有效控制自适应模型的复杂度;最后,给出一种加速近点梯度算法以求解新算法中引入的带有核范数正则项的数学优化问题。汉语连续语音识别的说话人自适应实验表明,引入低秩约束后,本征音子说话人自适应方法的自适应效果得到了明显提高,在5~50 s的自适应数据条件下,均取得了比最大似然线性回归后接最大后验(MLLR+MAP)自适应更佳的识别效果。  相似文献   

2.
本征音子说话人自适应算法在自适应数据量充足时可以取得很好的自适应效果,但在自适应数据量不足时会出现严重的过拟合现象。为此该文提出一种基于本征音子说话人子空间的说话人自适应算法来克服这一问题。首先给出基于隐马尔可夫模型-高斯混合模型(HMM-GMM)的语音识别系统中本征音子说话人自适应的基本原理。其次通过引入说话人子空间对不同说话人的本征音子矩阵间的相关性信息进行建模;然后通过估计说话人相关坐标矢量得到一种新的本征音子说话人子空间自适应算法。最后将本征音子说话人子空间自适应算法与传统说话人子空间自适应算法进行了对比。基于微软语料库的汉语连续语音识别实验表明,与本征音子说话人自适应算法相比,该算法在自适应数据量极少时能大幅提升性能,较好地克服过拟合现象。与本征音自适应算法相比,该算法以较小的性能牺牲代价获得了更低的空间复杂度而更具实用性。  相似文献   

3.
将稀疏贝叶斯学习引入线性混合像元分解中,提出一种基于复合正则化联合稀疏贝叶斯学习的高光谱稀疏解混算法.在多观测向量的稀疏贝叶斯框架下,对各参数建立概率模型,经贝叶斯推断得到基于L2,1正则化的联合稀疏贝叶斯解混模型,并将丰度向量的非负与和为一约束加入到凸优化的目标函数中,通过变量分离法将复合正则化问题分解成多个单一正则化问题交替迭代求解,并利用参数自适应算法对正则化参数进行更新.模拟数据和真实数据的实验结果表明,该算法比贪婪算法和凸优化算法能获得更高的解混精度,并且适用于端元个数较多和信噪比较低的高光谱数据.  相似文献   

4.
聂秀珍  郭爱英 《半导体光电》2018,39(6):874-878,885
为了解决图像超分辨率重建中稀疏系数解的不精确问题,提出了一种自适应正则化级联稀疏矩阵的超分辨率重建算法。根据图像自身的特性,采用自适应正则化项对图像局部进行处理,实现图像的局部约束,构建基于自适应正则化的稀疏矩阵函数。另外,为了提高图像的可清晰性,采用基于全局约束的退化模型改进处理结构。测试结果表明,与其他常用算法相比,提出的自适应正则化的图像超分辨率重建算法能够构建更清晰的超分辨率图像。  相似文献   

5.
为了提高生成型目标跟踪算法在遮挡、背景干扰 等复杂条件下的性能,在稀疏编码模型中引入l0范数正 则化约束,以减少冗余编码信息并改善目标表观重构效果。同时提出一种新的基于非凸近端 加速梯度的快速迭代算法, 解决由此产生的非凸非光滑优化问题。设计了一种增量低秩学习策略,和传统方法需 要将目标观测数据作为 一个整体进行低秩学习不同,本文方法通过l0正则化稀疏编码能够有效地对目标低秩特 征子空间进行在线学习和更 新。在多个视频序列上的实验表明:基于l0正则化的增量低秩学习方法能有效提高目标 跟踪算法的准确率和鲁棒性; 和8种优秀的跟踪算法相比,本文算法在中心误差稳健性和重叠率稳健性两个指标上都取得 了最好结果。  相似文献   

6.
为了更好地利用图像的稀疏性以提高变分模型的图像复原性能,在自适应高阶变分模型中对图像的一阶梯度加以组稀疏限制,建立一种非凸的组稀疏高阶变分模型.为实现该非凸模型的优化求解,采用交替方向乘子法将模型的极小化问题分解成多变量的子问题,进而采用IRL1与MM算法分别求解高阶变分与组稀疏极小化问题,实现退化图像的复原处理.通过...  相似文献   

7.
陈善培 《电信快报》2013,(10):42-44
在研究、分析和总结匹配追踪算法的基础上,论文提出一种新的基于变步长的正则化自适应匹配追踪算法。将自适应引入到正则化匹配追踪算法里,通过变步长来控制重建精度,在小稀疏度值信号范围内进行详细检测,在大稀疏度值信号范围内进行粗略检测。通过对信号稀疏度的准确定位,从而精确找到信号重建的支撑集,提高信号重构质量和噪声鲁棒性,对信号具有良好的重构概率。  相似文献   

8.
针对大数据背景下数据分类问题,已有的在线学习算法通常引入L1范数正则化增强预测模型的稀疏性,但单一的正则化约束不能高效的获取稀疏模型.基于此,提出了一种具有双重稀疏机制的在线学习算法(an online learning algorithm with dual sparse mechanisms,DSOL).在DSOL算法中,一方面利用L1/2正则化项约束目标函数以增强预测模型的稀疏性,提高算法的泛化性能.另一方面用改进的梯度截取法对数据特征进行选择,有效稀疏化预测模型.通过L1/2正则化与改进的梯度截取策略的有机融合,有效利用了历史数据信息,提高了算法分类数据的性能.通过与另4种代表性稀疏在线学习算法在9个公开数据集的实验对比表明DSOL算法对数据分类的准确性更高.  相似文献   

9.
针对采用1l 范数优化的稀疏表示DOA估计算法正则化参数选取困难、计算复杂度高的问题,该文提出一种基于稀疏贝叶斯学习的高效算法.该算法首先利用均匀线阵的结构特性,将DOA估计联合稀疏模型的构建与求解转换到实数域进行.其次,通过优化稀疏贝叶斯学习的基消除机制,使该算法具有更快的收敛速度.仿真结果表明,与1l 范数优化类算法相比,该文方法具有更高的空间分辨率和估计精度且计算复杂度低.  相似文献   

10.
该文提出一种基于最大似然可变子空间的说话人自适应方法。在训练阶段,对训练集中的说话人相关模型参数进行主分量分析,得到一组说话人基矢量;在自适应阶段,通过最大似然准则选取与当前说话人相关性最大的基矢量子集,进而将新的说话人相关模型限制在这组基矢量所张成的说话人子空间中,通过求解每一个基矢量对应的系数从而进行说话人自适应。与经典的基于子空间的说话人自适应方法不同,该文中的说话人子空间是在自适应阶段动态选取的,所需要估计的参数更少,在少量自适应数据下可以得到更稳健的自适应结果。在基于微软语料库的连续语音识别自适应实验中,给定极少量自适应数据(小于5 s),在有监督和无监督条件下,该文方法均优于经典的本征音自适应方法和基于最大似然线性回归的方法。  相似文献   

11.
引入梯度导引似p范数约束的稀疏信道估计算法   总被引:3,自引:0,他引:3  
伍飞云  周跃海  童峰 《通信学报》2014,35(7):21-177
为克服l0和l1范数约束的最小均方算法在不同信道稀疏程度下对稀疏信道估计中出现的收敛性能起伏较大等缺点,提出一种新的似p范数约束的最小均方算法,通过在最小均方算法代价函数中引入p值可变的似p范数约束以适应信道的不同稀疏程度,并在验证代价函数凸性的基础上导出p值的梯度导引寻优。文中最后给出仿真实验及其讨论,实验结果表明了新算法的优越性。  相似文献   

12.
Recently several speaker adaptation methods have been proposed for deep neural network (DNN) in many large vocabulary continuous speech recognition (LVCSR) tasks. However, only a few methods rely on tuning the connection weights in trained DNNs directly to optimize system performance since it is very prone to over-fitting especially when some class labels are missing in the adaptation data. In this paper, we propose a new speaker adaptation method for the hybrid NN/HMM speech recognition model based on singular value decomposition (SVD). We apply SVD on the weight matrices in trained DNNs and then tune rectangular diagonal matrices with the adaptation data. This alleviates the over-fitting problem via updating the weight matrices slightly by only modifying the singular values. We evaluate the proposed adaptation method in two standard speech recognition tasks, namely TIMIT phone recognition and large vocabulary speech recognition in the Switchboard task. Experimental results have shown that it is effective to adapt large DNN models using only a small amount of adaptation data. For example, recognition results in the Switchboard task have shown that the proposed SVD-based adaptation method may achieve up to 3-6 % relative error reduction using only a few dozens of adaptation utterances per speaker.  相似文献   

13.
周伟  孙玉宝  刘青山  吴敏 《电子学报》2016,44(3):627-632
经典的鲁棒主成分分析(Robust Principal Component Analysis,RPCA)目标检测算法使用l1范数逐一判别每一像素点是否属于运动目标,未能考虑到运动目标在空间分布的连续性,不利于提升运动目标检测的鲁棒性.本文提出了一种基于l0群稀疏RPCA模型的运动目标检测方法.首先运用Ncuts算法进行区域过分割,生成多个同性区域,将其作为群稀疏约束的分组信息;第二步构造基于l0群稀疏RPCA模型,运用群稀疏准则判别过分割后的各同性区域是否为运动目标,采用交替方向乘子算法对模型进行快速求解,约束过分割形成的同性区域具有相同检测结果,进而将背景环境和运动前景分离,能够更加准确地度量运动目标的区域边界,且对复杂的背景扰动更加鲁棒,达到了运动目标鲁棒检测的目的.  相似文献   

14.
The authors propose a channel compensation method for the hidden Markov model (HMM) parameters in automatic speech recognition. The proposed approach is to adapt the existing reference models to a new channel environment by using a small amount of adaptation data. The concept of HMM parameter adaptation by incorporating the corresponding phone-dependent channel compensation (PDCC) vectors is applied to improve the performance of speech recognition. Two extended PDCC techniques are presented. One is based on the refinement of PDCC using vector quantisation. The other is based on the interpolation of compensation vectors. Both techniques are evaluated on the experiments on telephone speech recognition and speaker adaptation. The experimental results show that the performance can be significantly improved  相似文献   

15.
马思扬  王彬  彭华 《电子学报》2017,45(9):2302-2307
针对深衰落稀疏多径信道下多进制相移键控(Multiple Phase Shift Keying,MPSK)信号的盲均衡问题,提出了一种l0-范数约束的分数间隔稀疏自适应双模式盲均衡算法.该算法借鉴传统的分数间隔双模式盲均衡算法思想,结合稀疏自适应滤波理论,首先利用l0-范数对均衡器抽头系数进行稀疏性约束,构造出一种l0-范数约束的分数间隔双模式最小均方误差代价函数,然后依据梯度下降法推导出盲均衡器抽头系数更新公式,并对迭代步长进行归一化和比例系数化.理论分析和仿真实验表明,与基于门限稀疏化的盲均衡算法、基于分数阶范数的盲均衡算法及分数间隔双模式盲均衡算法相比,本文所提算法在保证较快收敛速度的前提下,能有效降低剩余符号间干扰.本文设计的盲均衡算法为水声通信系统中接收方恢复出发送信号,提供了一种快速有效的方法.  相似文献   

16.
高畅  李海峰  马琳 《信号处理》2012,28(6):851-858
压缩感知理论依据信号的稀疏性质进行压缩测量,将信号的获取方式从对信号的采样上升为对信息的感知,是信号处理领域的一场革命。本文提出一种基于非确定基字典(Uncertainty Basis Dictionary, UBD)对语音信号进行稀疏表示的方法,将压缩感知理论应用于对语音信号稀疏表示的压缩,并提出了基于求解线性规划问题的方法重构语音信号的算法。通过语音识别、话者识别和情感识别实验,从面向内容分析的角度,研究这种基于压缩感知理论的信息感知方法是否保留了语音信号的主要内容。实验结果表明,语音识别、话者识别和情感识别的准确率,与目前这些领域研究方法得到的结果基本一致,说明基于压缩感知理论的信息感知方法能够很好地获取语音信号的语义、话者和情感方面的信息。   相似文献   

17.
当前基于预训练说话人编码器的语音克隆方法可以为训练过程中见到的说话人合成较高音色相似性的语音,但对于训练中未看到的说话人,语音克隆的语音在音色上仍然与真实说话人音色存在明显差别。针对此问题,本文提出了一种基于音色一致的说话人特征提取方法,该方法使用当前先进的说话人识别模型TitaNet作为说话人编码器的基本架构,并依据说话人音色在语音片段中保持不变的先验知识,引入一种音色一致性约束损失用于说话人编码器训练,以此提取更精确的说话人音色特征,增加说话人表征的鲁棒性和泛化性,最后将提取的特征应用端到端的语音合成模型VITS进行语音克隆。实验结果表明,本文提出的方法在2个公开的语音数据集上取得了相比基线系统更好的性能表现,提高了对未见说话人克隆语音的音色相似度。  相似文献   

18.
基于非负稀疏表示的SAR图像目标识别方法   总被引:1,自引:0,他引:1  
针对合成孔径雷达(SAR)图像目标识别中存在物体遮挡的情况,该文提出一种基于非负稀疏表示的分类方法。通过分析L0范数和L1范数最小化在求解非负稀疏表示问题上的区别,证明在一定条件下,L1范数最小化方法除了保持解的稀疏性还能得到与输入信号更加相似的原子集合,因此也更加适用于分类问题中。在运动和静止目标获取与识别(MSTAR)数据集上的识别实验结果表明,采用L1范数的非负稀疏表示分类方法能达到较好的识别性能,并且相对传统方法对存在遮挡情况下的识别问题更稳健。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号