首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 62 毫秒
1.
为了更准确地度量特征间的关系,提出了一种基于互信息自适应估计的目标函数表示方法。将具有自适应特性的度量方法引入到目标函数中,该目标函数以最大化类内相似度、最小化类间相似度为目标,并能根据深层特征的真实分布情况对相似度进行动态的调整,从而使深度神经网络朝着区分性更强的方向进行优化。此自适应度量方式还被用于特征筛选,其能够根据特征的特点进行有针对性的参数更新,使得选取的特征具有典型性,提升目标函数对于深度神经网络优化方向的指导能力。实验结果表明,相比于其他深度神经网络方法,该方法的相对等错误率最多降低了28%,显著提升了说话人确认系统的性能。  相似文献   

2.
提出一种基于稀疏神经网络的说话人分割方法,利用稀疏的单隐层神经网络提取语音的超矢量特征中说话人因子特征,然后通过K均值聚类得到每帧语音的标号来分割不同说话人,在稀疏网络的训练过程中引入了dropout技术以克服过拟合问题.在TIMIT语音数据库构成的多说话人语音数据上的实验结果表明:通过增加稀疏网络中隐层节点的个数可以提高说话人分割的效果,与贝叶斯信息准则(Bayesian information criterion,BIC)方法和稀疏自编码网络方法相比,所提基于稀疏神经网络的说话人分割方法的性能有明显提高.  相似文献   

3.
针对传统卷积神经网络(CNN)模型构建过度依赖经验知识、参数多、训练难度大等缺点,同时鉴于复杂多类问题的CNN模型构建策略的重要价值,提出一种自适应深度CNN模型构建方法.首先,将初始网络模型的卷积层和池化层设置为仅含一幅特征图;然后,以网络收敛速度为评价指标,对网络进行全局扩展,全局扩展后,根据交叉验证样本识别率控制网络展开局部扩展,直到识别率达到预设期望值后停止局部网络学习;最后,针对新增训练样本,通过拓展新支路实现网络结构的自适应增量学习.通过图像识别实验验证了所提算法在网络训练时间和识别效果上的优越性.  相似文献   

4.
梅尔倒谱系数是一种常用于说话人识别的特征参数,韵律特征是一种描述人的声门特性的参数。为融合MFCC与韵律特征,以图优化说话人确认系统性能,该文采用二次判决的方法来处理这两个特征;参与第二次判决的语音则由通过大量实验制定的判决空间来确定。实验结果表明,采用二次判决时,系统等错误率从仅使用MFCC时的5.56%的下降至4.37%。  相似文献   

5.
本文提出了一种基于GMM(Gaussian Mixture Model)的说话人分类算法,主要介绍了GMM模型和具体实现以及基于GMM的说话人分类算法在关键词检测系统中的应用。实验结果证明,该算法计算量小、实现速度快,能够提高系统的识别率,扩大应用人群范围,在中小词汇表识别系统中有关非常广阔的前景。  相似文献   

6.
将小波变换和神经网络结合起来应用于说话人身份识别.通过小波变换提取语音信号的基音周期序列不仅体现了人发声时的生理特点,同时还包含了个人说话习惯等后天形成的特征.所以它能有效地反映说话人的语音特点.应用人工神经网络对基音周期序列进行识别分类以确定说话人身份.实验证明应用人工神经网络进行特征识别直接输出代表说话人身份的二进制编码,可以省去与库中所有数据进行匹配的繁琐操作,同时又能保证较高的正确率.  相似文献   

7.
由于CPSO--BP神经网络通过在粒子群优化算法中引入混沌思想,改善了粒子群优化算法摆脱局部极值点的能力,提高了BP网络的计算精度和收敛速度,使得基于BP神经网络的说话人识别其识别率和训练速度都得到较大提高。本文将该识别技术应用到身份认证中,提出了一种新的基于生物特征的身份认证方案,通过对其性能的分析研究,新的方案是安全有效的。  相似文献   

8.
提出了一种基于改进的语音融合特征和GMM模型相结合的跨语种说话人确认方法.首先,采用Teager能量算子提取语音中的浊音段,消除与说话人声道特征无关的静音段和清音段.其次,提取基音周期参数,并与16维的MFCC参数融合形成本文的语音融合特征.最后,将本文方法与文献[9]的方法分别进行了单语种和跨语种的说话人确认对比实验,实验结果表明本文方法识别准确率和平均判别时间均优于文献[9]的方法,证明本文提出的方法有效,可用于跨语种的说话人确认应用领域.  相似文献   

9.
针对BP神经网络收敛速度慢、容易陷入局部极小的缺陷,将遗传算法全局寻优的特点与BP神经网络相结合,利用遗传算法对神经网络的权值和阈值进行优化,构成一个GABP神经网络,有效地解决了BP神经网络容易陷入局部最优的问题。实验结果表明:相对于BP神经网络的说话人识别系统,基于GA-BP神经网络的说话人识别系统具有更快的网络收敛速度和更高的系统识别率。  相似文献   

10.
目前说话人识别系统的识别率已经达到较高的水平,但是在应用系统的整合方面还存在一定的问题,比如其算法的复杂度高,不易于低成本的硬件实现等都限制其达到普及化.针对这样的问题,提出一种高性能、结构简单的基于自组织映射(SOFMNN)和概率神经网络(PNN)的混合神经网络分类器以取代目前常用的高斯混合模型(GMM)分类器.实验结果表明,混合神经网络分类器在识别率、识别速度和存储量上都优于高斯混合模型分类器.混合神经网络模型是一种高性能、高效率的说话人识别系统,该系统在说话人识别中将会有很好实用价值.  相似文献   

11.
作为典型的模式识别任务,人脸识别有着巨大的实际应用价值与市场前景。理想环境下的人脸识别已经取得不俗成绩,然而,当所处环境变化(如姿态变换、夸张表情、阴阳脸、分辨率较低)时,识别难度增加,效果也急剧变差。与此同时,现有大多数方法无法实时(在线)完成人脸识别任务,这也限制了人脸识别技术的应用。为此,该文以深度神经网络为框架,使用大规模人脸库构造了一种新型实用的多层网络应用于大规模的人脸识别任务中并提出了一种新的搜索策略。实验结果表明,该套方法实时性好,识别率较高,是人脸识别较为理想的方案。  相似文献   

12.
提出了一种应用于跨年龄人脸识别的联合学习方法,该方法由深度卷积神经网络构建而成,能在特征学习的同时学习到最优的测度函数,从而避免不合适的固定阈值所带来的匹配错误.针对有限的内存、过拟合和计算复杂性高的问题,在模型训练过程中采用了多种新颖和有效的训练策略.实验证实了该联合学习方法的有效性,在公开数据库MORPH-II上的识别正确率达到了93.6%.  相似文献   

13.
采用RBF神经网络方法对麻醉状态下诱发脑电仿真信号进行分析,提出了一种通过基于RBF神经网络权值构造特征向量的特征提取方法,以达到提取信号特征的目的,并用BP神经网络分类器对提取的特征进行聚类,从而实现深浅麻醉状态下诱发脑电信号的分类,实验仿真结果表明了该方法的有效性.  相似文献   

14.
提出了一种新的基于递归神经网络的快速收敛盲均衡算法。设计中采用观测信号的四阶统计量构造代价函数,简化了系统的复杂度;利用实时递归学习算法对系统参数进行动态调节。该算法具有镇定性,其收敛性能不会受到失真信道的影响,适用于均衡衰落性严重的信道。实验仿真结果表明对具有频率选择性衰落的非线性信道,该算法在收敛速度和对抗码间串扰方面都具有良好的性能。  相似文献   

15.
BP神经网络的入侵系统分析   总被引:1,自引:0,他引:1  
利用改进算法的学习能力和快速识别能力,实现了对用户行为的检测,尤其是在识别以前没有观察到的未知攻击方面具有较好的性能。  相似文献   

16.
针对提高快递包裹的分拣效率和识别准确率,提出了一种基于深度神经网络复杂场景下的机器人拣选方法.首先,提出一种改进的目标检测算法,通过将多层浅层特征图与最终的特征图进行融合,提取更加细节的特征,以提升识别的速度与精度;其次,提出了一种基于关键点的级联卷积最优拣选位置检测网络模型,对包裹最优拣选位置进行实时预测估计;最后,结合目标包裹最优拣选框与场景的深度信息和基于三维信息的目标姿态估计算法实现机器人拣选,并通过实验验证了该方法的有效性.  相似文献   

17.
为提高连续语音识别中的音素识别准确率,采用深可信网络提取语音音素后验概率进行音素识别.首先利用受限玻尔兹曼机的学习原理,对深可信网络进行逐层的预训练;然后通过增加一个“软最大化(softmax)”输出层,得到用于音素状态后验概率检测的深层神经网络,并采用后向传播算法进行网络权值的精细调整;最后以后验概率为HMM发射概率,使用Viterbi解码器进行音素识别.针对TIMIT语料库的实验结果表明,该系统的音素识别率优于GMM/HMM,MLP/HMM和TANDEM系统性能.  相似文献   

18.
基于神经网络的板料拉深成形摩擦系数预测   总被引:2,自引:0,他引:2  
板料拉深成形过程中,摩擦是一个很重要的参数,受很多因素影响,本文利用神经网络建立了板料拉深成形中润滑油、模具表面粗糙度、拉深速度和板料表面粗糙度与摩擦系数的BP神经网络摩擦模型,对板料拉深成形的有限元分析及优化设计具有重要的参考价值.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号