首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 58 毫秒
1.
使用受限玻尔兹曼机和反向传播(BP)神经网络相结合的方法,充分利用受限玻尔兹曼机自动提取数据的内在特征的能力,以及BP神经网络的学习能力,对已建立的装备保障评价体系进行评估。利用Matlab对方法的有效性进行验证,通过公共数据集进行仿真。结果表明,用该方法获得的评估值精确度较高,具有良好的识别率。  相似文献   

2.
深度学习在高维特征向量的信息提取和分类中具有很强的能力,但深度学习训练时间也比较长,超参数搜索空间大,从而导致超参数寻优较困难。针对此问题,该文提出一种基于受限玻尔兹曼机(RBM)专家乘积系统的改进方法。先将专家乘积系统原理与RBM算法相结合,采用全是真实概率值的参数更新方式会引起模型识别效果不理想和带来密度问题,为此将其更新方式进行改进;为加快网络收敛和提高模型识别能力,采取在RBM预训练阶段和微调阶段引入不同组合方式动量项的一种改进算法。通过对MNIST数据库中的0~9的手写数字体的识别和CMU-PIE数据库的人脸识别实验,提出的算法减少了学习时间,提高了超参数寻优的效率,进而构建的深层网络能获得较好的分类效果。试验结果表明,提出的改进算法在处理高维大量的数据时,计算效率有较大提高,其算法有效。  相似文献   

3.
杨杰  孙亚东  张良俊  刘海波 《电子学报》2014,42(12):2365-2370
针对现有特征提取方法难以实现从含有复杂背景的图像中提取有用目标特征的瓶颈问题,提出了基于弱监督学习的去噪受限玻尔兹曼机特征提取算法.首先,利用训练样本,通过无监督学习方式训练一个标准受限玻尔兹曼机模型,从而获得一个包含可视单元层和隐藏单元层的层次结构模型;然后,对可视层的每个单元引入二值转换单元,对隐藏层,根据各节点的激活值大小和激活频率将其分为两组:前景特征隐层单元和背景特征隐层单元,得到一个二元混合式去噪玻尔兹曼机的模型;最后,通过多模交互方式,利用有限数量的样本标签信息对输入样本逐像素地进行采样训练,以此来提取目标特征.实验表明,本文的特征提取算法能够有效地从复杂的干扰背景中提取目标特征,提高了目标识别精度.  相似文献   

4.
为了提高大动态信噪比下数字调制识别性能,提出一种基于高阶累积量和判别式受限玻尔兹曼机的联合调制识别方法.该方法提取数字信号的高阶累积量作为信号特征,综合利用判别式受限玻尔兹曼机的生成能力和分类能力,分析了含有高斯噪声、时变相位偏移或瑞利衰落环境下的数字信号识别率.实验结果表明,与传统识别方法相比,所提方法的识别性能有明...  相似文献   

5.
6.
在现代通信系统中,电话语音的频带被限制在300 Hz~4 kHz的范围内,带来了语音可懂度和自然度的降低.为了在不增加额外成本的前提下提高语音的可懂度和自然度,进行了电话语音频带扩展的研究.提出了一种改进的基于码本映射的语音带宽扩展算法:在码本映射的过程中,使用加权系数来得到映射码本.客观测试结果表明,用此算法得到的宽带语音的谱失真度比用一般的码本映射降低至少2%.主观测试结果表明,用此算法得到的宽带语音具有更好的可懂度和自然度.  相似文献   

7.
沈卉卉  李宏伟 《电子学报》2019,47(1):176-182
深度学习给模式识别与机器学习带来了巨大的变化,已成功应用于语言处理、图像处理、信号处理、商业经济等方面.受限玻尔兹曼机(Restricted Boltzmann Machine,RBM)是一个表示能力强、很好的生成模型,多个RBM堆叠而构成的深度信念网络模型(Deep Belief Nets,DBN)的学习时间会较长.为加快整个DBN网络的学习时间和提高分类效果,本文提出基于动量方法RBM的一种有效算法.该算法在RBM预训练阶段,结合梯度上升算法特点采取快速上升的动量方式;以及BP算法微调阶段,为了能精确的找到最优点,结合梯度下降算法特点,相应的引入缓慢下降式的动量项,即在梯度上升和梯度下降过程中都使用不同的动量方式.本文算法在MNIST手写数字体和CMU-PIE人脸数据库上进行了实验,结果表明,提出的改进算法能够有效地增强图像特征的表达能力,提高图像的分类效果和实验效率.  相似文献   

8.
《无线电通信技术》2019,(4):412-414
基于带宽受限传输系统和已成为主流的VoIP语音通信业务,对在带宽受限的情况下传输多路VoIP语音的解决方案进行了介绍。提出了一种话音和信令分离的新型帧结构,通过去除IP语音数据的IP包头和RTP包头等冗余信息,并基于该帧结构重新打包传输,有效改善了网络带宽的利用率,解决了带宽受限信道VOIP话音传输效率问题,以此为核心设计了一种匹配窄带通信系统的综合业务终端设备。  相似文献   

9.
该文提出了一种基于深度信念网络(DBN)和多维扩展特征的模型,实现对中文微博短文本的情感分类。为降低传统文本分类方法在处理微博短文时特征稀疏的影响,引入社交关系网络作为扩展特征,依据评论者和博主之间的社交关系,提取相关评论扩展原始微博,将扩展后的多维特征作为深度信念网络的输入。通过叠加多层玻尔兹曼机(RBM)构建DBN模型底层网络结构,多层玻尔兹曼机可以对原始输入抽象并获得数据的深层语义特征。在多个RBM层上叠加一层分类玻尔兹曼机(ClassRBM),实现最终情感分类。实验结果表明,通过调整模型参数和网络结构,构建的深度学习模型在情感分类中能够获得比SVM和NB等浅层分类系统更优的结果,另外,实验证明使用扩展多维特征方法可提高短文本情感分类的性能。  相似文献   

10.
智慧城市依赖于对大数据的充分利用。近年来,随着移动互联网的发展,在线微博平台,比如新浪微博、Twitter等,已经成为了大数据的主要来源之一。微博平台上产生的海量短文文本信息使用户很难找到自己感兴趣主题的相关信息。本文提出了一种基于限制性玻尔兹曼机的微博短文本的主题分类方法。通过对短文本进行主题建模,挖掘出潜在主题信息,根据短文本的潜在主题信息可实现对短文本的主题分类。  相似文献   

11.
张兴涛  鲍长春  刘鑫  张丽燕 《电子学报》2012,40(12):2501-2506
 本文采用非线性分析方法,基于Volterra级数提出了一种宽带音频信号的频带扩展方法,并利用高斯混合模型(Gaussian Mixture Model,GMM)和码本映射技术对扩展后的音频信号进行了谱包络和能量增益调整.实验表明,所提算法的性能要好于已有的非线性频带扩展算法,当用本文的方法替代ITU-T G.722.1C编码器中的噪声填充技术时,在24kbps得到了提升的超宽带音频质量.  相似文献   

12.
白海钏  鲍长春  刘鑫 《电子学报》2016,44(9):2203-2210
在网络传输过程中宽带音频会由于高频信息的缺失导致音频质量下降,因此,本文提出了一种基于局部最小二乘支持向量机的宽带向超宽带音频频带扩展方法.根据音频频域序列的非线性特性,本文采用相空间重构和局部最小二乘支持向量机对音频信号的高频频谱细节进行预测,并结合高斯混合模型对高频子带能量进行估计,最后经过高频频谱包络调整,所提方法能够有效地恢复7kHz~14kHz频率范围内的高频成分.主客观测试结果表明,该方法改善了宽带音频的听觉质量,其性能优于参考音频频带扩展方法.  相似文献   

13.
刘鑫  鲍长春 《电子学报》2015,43(4):816-821
宽带音频带宽的限制会降低其主观质量和自然度.本文提出了一种基于相似关联度神经网络的宽带向超宽带音频频带扩展方法.该方法将宽带音频的精细谱重构成多维相空间,并建立相似关联度神经网络来恢复高频成分的精细谱,同时借助高斯混合模型估计高频谱包络,并以G.722.1编码器为平台实现音频信号的带宽扩展.测试结果表明,本文方法扩展性能优于参考方法,其主观质量接近于G.722.1C超宽带编码器.  相似文献   

14.
受到传输带宽的限制,宽带音频的自然度和听觉质量会有所下降,因此,本文提出了一种基于灰色Verhulst模型的宽带向超宽带音频频带扩展方法.根据音频信号频谱包络序列的演变趋势,采用灰色Verhulst模型对高频频谱包络进行估计,并利用最近邻匹配方法对高频频谱细节进行预测,最后经过高频频谱包络的调整,所提方法能够有效地恢复7~14kHz频率范围内的高频成分.主客观测试表明,该方法改善了宽带音频的听觉质量,并且优于传统的基于高斯混合模型的音频频带扩展方法.  相似文献   

15.
提出一种基于压缩感知的"非盲式"带宽扩展算法,并利用"盲式"带宽扩展模块以进一步改善算法的性能。主客观测试结果表明,基于压缩感知的"非盲式"带宽扩展算法能够实现音频信号的高频重建,且在满足信号完美重建的条件下,重建音频质量要优于AMR-WB+中的带宽扩展算法。  相似文献   

16.
刘鑫  鲍长春 《电子学报》2016,44(11):2758-2766
宽带音频通信系统对传输信号有效带宽的限制会降低重建音频的主观质量和自然程度.本文提出了一种基于回声状态网络的宽带向超宽带音频盲目式频带扩展方法.该方法借助回声状态网络来模拟音频信号高低频频谱参数间的映射关系,并依据网络模型中的时延递归结构连续更新系统状态来近似描述音频特征的时域演变过程,有效地估计了高频成分的频谱包络.同时,结合频谱复制方法得到的高频频谱细节,该方法实现了宽带向超宽带音频的有效扩展.测试结果表明,本文所提方法提升了宽带音频的听觉质量;对于多数测试数据,该方法在静态和动态失真方面获得了优于高斯混合模型扩展方法的扩展性能.  相似文献   

17.
In this paper, two speech enhancement systems with supergaussian speech modeling are presented. The clean speech components are estimated by Minimum-Mean-Square-Error (MMSE) estimator under the assumption that the DCT coefficients of clean speech are modeled by a Laplacian or a Gamma distribution and the DCT coefficients of the noise are Gaussian distributed. Then, MMSE estimators under speech presence uncertainty are derived. Furthermore, the proper estimators of the speech statistical parameters are proposed. The speech Laplacian factor is estimated by a new decision-directed method. The simulation results show that the proposed algorithm yields less residual noise and better speech quality than the Gaussian based speech enhancement algorithms proposed in recent years.  相似文献   

18.
递归神经网络(Recurrent Neural Network, RNN)如今已经广泛用于自动语音识别(Automatic Speech Recognition, ASR)的声学建模。虽然其较传统的声学建模方法有很大优势,但相对较高的计算复杂度限制了这种神经网络的应用,特别是在实时应用场景中。由于递归神经网络采用的输入特征通常有较长的上下文,因此利用重叠信息来同时降低声学后验和令牌传递的时间复杂度成为可能。该文介绍了一种新的解码器结构,通过有规律抛弃存在重叠的帧来获得解码过程中的计算开销降低。特别地,这种方法可以直接用于原始的递归神经网络模型,只需对隐马尔可夫模型(Hidden Markov Model, HMM)结构做小的变动,这使得这种方法具有很高的灵活性。该文以时延神经网络为例验证了所提出的方法,证明该方法能够在精度损失相对较小的情况下取得2~4倍的加速比。  相似文献   

19.
基于电话用户交换机的语音识别系统研究   总被引:3,自引:0,他引:3  
本论文对电话用户交换机研制了一个声控语音命令交换系统,该系统能够实现与特定人无关中小词汇量连续命令语音自动识别,研究中统计了用和命令语句,生成相应识别文法网络,识别系统的训练采用由子词模型构成的复合模型进行强化训练,识别采用令牌传递式改进Viterbi算法,提高系统的识别性能,论文比较了不同语音特征参数以及隐含马尔可夫模型状态数对电话语音识别精度的影响,研究中还开发识别系统拒识系统,在无拒识情况下  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号