首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 375 毫秒
1.
说话人识别就是从说话人的一段语音中提取出说话人的个性特征,通过对这些个人特征的分析和识别,从而达到对说话人进行辨认或者确认的目的。神经网络是一种基于非线性理论的分布式并行处理网络模型,具有很强的模式分类能力及对不完全信息的鲁棒性,为说话人识别技术提供了一种独特的方法。BP(Back-propagation Neural Network)是一种非循环多级网络训练算法,有输入层,输出层和N个隐含层组成。首先概述了语音识别技术,介绍了BP神经网络训练过程的7个步骤及其模型,如何建立BP神经网络模型。同时介绍了与其相关的特征参数的提取,神经网络的训练和识别过程,最后,通过编程在Linux系统下实现说话人身份的识别。  相似文献   

2.
语音是人机交互方式之一,语音识别技术是人工智能的重要组成部分.近年来神经网络技术在语音识别领域的应用快速发展,已经成为语音识别领域中主流的声学建模技术.然而测试条件中目标说话人语音与训练数据存在差异,导致模型不适配的问题.因此说话人自适应(SA)方法是为了解决说话人差异导致的不匹配问题,研究说话人自适应方法成为语音识别领域的一个热门方向.相比传统语音识别模型中的说话人自适应方法,使用神经网络的语音识别系统中的自适应存在着模型参数庞大,而自适应数据量相对较少等特点,这使得基于神经网络的语音识别系统中的说话人自适应方法成为一个研究难题.首先回顾说话人自适应方法的发展历程和基于神经网络的说话人自适应方法研究遇到的各种问题,其次将说话人自适应方法分为基于特征域和基于模型域的说话人自适应方法并介绍对应原理和改进方法,最后指出说话人自适应方法在语音识别中仍然存在的问题及未来的发展方向.  相似文献   

3.
针对孤立词语音识别的任务,采用一维卷积神经网络(CNN)作为声学模型,利用卷积核在时间轴上的移动来反映语音信号的时变性,从而提高识别性能。然后引入了反映说话人特征的身份认证矢量i-vector,通过i-vector特征消除说话人差异对识别造成的影响,进一步提高识别性能。在实验室自建语音库上的实验表明,基于这两种方法的识别系统达到了91%的识别准确率。  相似文献   

4.
一种与文本有关的说话人识别系统设计与实现   总被引:3,自引:0,他引:3  
该文设计并实现了一种基于小波变换和线性预测的语音信号特征提取方法(DWT—LPC)和自组织神经网络的与文本有关的说话人识别系统。该系统包括端点检测、特征提取、说话人识别、网络训练和神经网络参数五部分,结构简单,实时性能好,并且网络训练所需数据少。用MATLAB对说话人识别系统进行仿真实验,选择由元音、轻辅音和浊辅音组成的本文,经过测试,识别率达98.5%。  相似文献   

5.
遗传算法与BP神经网络相结合的说话人识别系统   总被引:2,自引:0,他引:2  
基于BP神经网络的说话人识别系统是目前说话人识别中的一种主要模型,但BP神经网络通常难以确定隐含层单元的数目,且收敛速度慢。针对此缺点,提出了一种基于遗传算法(GA)的说话人识别BP神经网络优化方案,该方案利用混合编码的GA对神经网络的连接权和结构进行了优化,可以有效地剔除整个网络冗余节点和冗余连接权,方案利用了BP神经网络的并行性和GA的全局搜索能力,显著地改善了网络的处理能力。实验表明:基于混合编码GA的BP神经网络具有快速学习网络权重的能力,识别率高,是说话人识别的一种有效可行的新方案。  相似文献   

6.
用于神经网络说话人识别的PCA-GA研究   总被引:1,自引:1,他引:0  
针对用于神经网络说话人识别的海量特征参数带来的识别率和网络训练稳定性的问题,提出了一种用于神经网络的基于语音特征参数的PCA新方法.该方法提取出的新特征参数在神经网络中的识别率和训练速度得到较大提高.结合GA能有效防止网络收敛于局部极小点,缩短训练时间,提高网络稳定性.从而全面提高了基于NN的说话人识别效果.  相似文献   

7.
基于PCNN的语谱图特征提取在说话人识别中的应用   总被引:8,自引:1,他引:7  
该文首次提出了一种将有生物视觉依据的人工神经网络——脉冲耦合神经网络(PulseCoupledNeuralNetwork,以下简称为PCNN)用于说话人识别领域的语谱图特征提取的新方法。该方法将语谱图输入到PCNN后得到输出图像的时间序列及其熵序列作为说话人语音的特征,利用它的不变性实现说话人识别。实验结果表明,该方法可以快速有效地进行说话人识别。该文将PCNN引入到语音识别的应用研究中,开拓了信号处理中两个极为重要的部分———语音信号处理和图像信号处理结合的新领域,同时对于PCNN的理论研究和实际应用具有非常重要的现实意义。  相似文献   

8.
说话人识别是语音识别的一种,是当前的研究热点之一。而基于统计学习理论的支持向量机(SVM)方法是一种新的机器学习算法,已成为机器学习研究的热点。讨论了一种改进的SVM即最小二乘向量机(LS-SVM)的方法进行说话人识别研究。研究表明,基于LS—SVM的说话人识别比传统的SVM说话人识别计算复杂度小、效率更高、对说话人识别有很强的适应性。  相似文献   

9.
针对目前说话人识别模型精度不高,应用性不强的缺点,提出一种采用熵相关性优化原始特征参数的方法,并综合特征熵相关性和原始特征特性值两方面因素改进了说话人识别的分离性测度。以说话人聚类类间差异最大化为目标,建立围绕基于特征分类相关性的参数自适应重构策略及分离性测度计算方法的说话人识别模型。仿真实验结果表明,该模型结构稳定,使说话人识别的精度及效率达到较好的平衡,具有较强的应用性能。  相似文献   

10.
传统说话人识别框架大多建立在高斯混合模型(GMM)上的,然而这种浅层学习模型不能有效地表征数据特征之间的高阶相关性,识别效果较差。本文提出一种基于深度神经网络(Deep Neural Network, DNN)与基音周期(Pitch Period, PP)相结合的说话人识别方法,模型主线识别以对数梅尔滤波器组特征参数作为DNN的输入,通过训练DNN模型提取说话人的声纹特征;针对DNN模型阈值设定人的主观性影响,利用动态时间规整技术匹配说话人基音周期进行辅助识别。实验结果表明,这种双重识别方法等错误率可以达到1.6%,较DNN系统与EM-GMM系统等错误率分别降低了1.2%和2.4%,并且在噪声环境中仍具有较好的鲁棒性。  相似文献   

11.
近年来,随着我国科学技术的不断深入与发展,神经网络逐渐与语音识别技术联系的越来越密切。在传统的语音识别技术中,模板匹配法是其主要的操作方法,而在现代的语音识别技术中,神经网络已成为主要的发展趋势。神经网络技术主要模拟了人类的神经元活动原理,将人类所特有的自主学习、想象能力综合到了语音识别系统中,为语音识别的发展开辟了一条新的途径。本文我们将综合具体事例简要分析深度学习神经网络与语音识别系统的结合。  相似文献   

12.
基于ANN和HMM的联机手写体汉字识别系统   总被引:1,自引:0,他引:1  
为了解决联机手写体汉字笔划顺序、笔划数目及笔划形状变化问题,提出了一种新的联机手写体汉字识别方法:人工神经网络(ANN)和隐马尔可夫模型(HMM)相结合的汉字识别方法,首先通过BP神经网络进行笔划识别,再通过笔划类型和笔划间位置关系的隐马尔可夫模型进行整字识别。实验证明,该联机手写体汉字识别系统具有较高地识别准确率。  相似文献   

13.
文章提出了一种优化的多层神经网络,能完成对图像不变性模式识别。基于此多层神经网络开发了人脸识别系统。仿真实验表明该人脸识别系统,具有较高的识别速度、准确率、容错性和鲁棒性,并且基本解决了开发实用化的人脸识别系统所面临的问题,即模式识别不变性的问题。  相似文献   

14.
针对语音识别的特点,对BP神经网络在语音识别技术中的应用进行了探索性研究,进而结合人工智能领域较为有效的方法——遗传(GA)算法,针对传统BP算法识别准确率高但训练速度慢的缺点,对BP网络进行改进,构建了一种基于遗传神经网络的语音识别算法(GABP),并建立相应的语音识别系统。仿真实验表明,该算法有效地缩短了识别时间,提高了网络训练速度和语音的识别率。  相似文献   

15.
张绍兵 《计算机测量与控制》2008,16(12):1994-1995,2002
针对无指针式仪表表盘的数字识别问题,提出一种基于特征提取和粗糙集特征约简的神经网络数字识别方法;该方法首先利用数字图像预处理技术处理图像并利用特征提取方法提取数字图像特征,然后利用粗糙集理论进行特征约简,最后将约简后的信息输入到训练好的神经网络进行识别;实验表明,相对于传统方法,该方法具有识别率高、速度快的特点,具有较高的实用价值;并且该方法在保留神经网络高鲁棒性的同时,为快速准确地进行数字识别开辟了新的途径。  相似文献   

16.
基于深度学习的步态识别算法优化研究   总被引:1,自引:0,他引:1  
基于深度学习的神经网络,对步态识别算法进行了优化研究。利用粒子群优化BP神经网络阈值、权值,在神经网络中代入优化后的初始值进行训练,避免陷入局部最优。通过Vicon MX系统对角度特征值进行采集,利用基于粒子群优化BP神经网络进行识别,验证其识别步态的可行性;筛选出传感器系统特征值,在对其优化改进时选取粒子群优化BP神经网络。与传统神经网络法、粒子群优化法相比,基于粒子群优化BP神经网络法的识别方式,识别时间短且识别率高。  相似文献   

17.
针对语音识别的特点,对BP神经网络在语音识别技术中的应用进行了探索性研究,进而结合人工智能领域较为有效的方法——遗传(GA)算法,针对传统BP算法识别准确率高但训练速度慢的缺点,对BP网络进行改进,构建了一种基于遗传神经网络的语音识别算法(GABP),并建立相应的语音识别系统。仿真实验表明,该算法有效地缩短了识别时间,提高了网络训练速度和语音的识别率。  相似文献   

18.
一种新颖的眼部状态识别方法   总被引:5,自引:0,他引:5  
李衡峰  夏利民  叶剑波 《计算机工程》2005,31(6):166-167,170
在疲劳驾驶检测中,对眼部状态的判断是关键的步骤之一.为了对眼部状态进行有效的识别,提出了一种新颖的眼部状态识别方法.该方法用眼部图像中的某些点的纹理单元的N.值作为输入特征值,用径向基函数神经网络(RBF)作为分类器.为了进一步提高分类的准确性,又采用了Bagging方法.试验结果表明,该方法易于实现,准确度高,速度快,不受光照条件的影响,可以应用于实际.  相似文献   

19.
手写笔迹识别是模式识别的一个重要研究领域。因为每个人的书写习惯有所不同,导致手写的字体有一定的差异。传统的Softmax模型在手写数字的识别结果上并没有达到人们的期望。目前,深度神经网络框架是模式识别领域的主流方法。长短期记忆神经网络(long-short term memory network,LSTM)是一种特殊的循环神经网络,它由输入门、遗忘门、输出门以及神经元组成。长短期记忆神经网络对于长序列问题有很好的处理。文中提出采用双向长短期记忆神经网络进行手写数字识别。采用MNIST数据集,分别使用传统的Softmax方法和双向长短期记忆神经网络方法对MNIST数据集里的图片进行识别。实验结果表明,传统的Softmax模型的正确率为92%左右,而LSTM模型的正确率达到了96.3%,提升4.3%。  相似文献   

20.
基于组合特征的Bp神经网络数字识别方法   总被引:1,自引:0,他引:1  
提出一种组合特征作为Bp神经网络输入层向量实现数字字符识别算法.该算法首先引入了数字字符结构特征中图段特征,并结合数字字符的行列统计特征组合成为新的特征向量;然后根据新的组合特征向量设计Bp神经网络分类器;最后对已有的数字图像样本空间中的训练样本库按照Bp神经网络分类器训练方法进行训练,并对测试样本库中的样本进行识别.根据测试实验,数字字符的识别准确率可达到94%以上.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号