首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
全刚  肖熙 《电声技术》2010,34(6):45-47
数字语音识别具有很高的识别率,具有较高的实用价值。为实现在真实噪声环境下能达到高识别率的数字语音识别系统,采用基于段长分布的隐马尔可夫模型(DDBHMM)进行了安静环境和带噪环境下,特定人和非特定人的数字语音识别试验。试验结果表明,基于DDBHMM模型的数字语音识别技术对真实非平稳噪声环境下录制的特定人和非特定人语音都具有较高识别率。  相似文献   

2.
将语音识别技术应用于拨号系统,在嵌入式平台上实现了一款针对非特定人的数字语音拨号系统。语音识别算法中选择梅尔频率倒谱系数为特征参数,连续隐马尔科夫模型。为训练和识别过程模型,利用Qt界面对识别过程进行控制,系统针对非特定人数字语音识别进行实验。结果表明,系统针对非特定人识别率达到了98%,识别时间为3.55S。识别率和实时性都满足语音拨号的需求。  相似文献   

3.
本文论述了基于神经网络模型的非特定人汉语语音识别。我们采用24人(12人用于训练,12人用于测试)的语音数据对汉语十个数字和十个孤立字进行了实验,取得了96.3%(10个数字)和97.2%(十个汉字)的识别率。  相似文献   

4.
本文从模板匹配的角度研究了多层前向感知机(MLP)在汉语孤立数目字语音识别中的应用,针对训练样本数受限的情况提出了新的训练方法,研究了语音固化、特征提取、学习算法和策略诸方面问题。对特定人和非特定人汉语孤立数目字语音识别分别达至了95.7%和93.0%(无拒识)的识别率。  相似文献   

5.
《现代电子技术》2019,(14):152-156
语音识别作为人工智能研究中不可或缺的一部分已经逐渐渗透到人们的日常生活中。针对传统语音识别方法不能很好地实现并识别复杂多变、非特定人语音的问题,文中提出利用在时间序列上关联性较强的循环神经网络(RNN)建立语音识别模型。考虑到语音信号丰富的时频信息表达,在特征提取环节进行改进,利用具有较好时频分辨率的小波变换(WT)取代快速傅里叶变换(FFT)作为该模型的输入;然后,采用随时间展开的反向传播算法(BPTT)进行特征学习与训练。在实验测试中,首先,对比分析了基于小波变换的特征提取对识别效果的影响;其次,通过与传统的HMM模型及BP神经网络的识别率做对比,验证RNN神经网络可提高语音识别准确率和稳定性。  相似文献   

6.
本文根据加权倒变距离测度,提出了一种用于非特定人语音识别的函数链神经网络。此网络与多层感知器相比,不仅具有较高的识别别率,而且大大缩短了网络的学习时间。我们采用6人(3男,3女)的语音数据对汉语十个数字进行了实验,正确识别率为93.7%。  相似文献   

7.
《现代电子技术》2017,(16):13-18
以语音信号的语谱图作为处理对象,提出一种基于宽窄带语谱图傅里叶变换频域图像二进宽度分带投影特征融合的二字汉语词汇语音识别算法。首先,对宽窄语谱图傅里叶变换频域图的图像意义以及相应的语音特性进行分析;然后,分别对宽窄带语谱图频域图像进行二进宽度分带列投影和行投影,将投影值作为语音识别的第一个特征参数集合和第二个特征参数集合,将以上两个特征集进行特征融合作为二字词汇语音识别的特征量,以支持向量机为分类器实现二字汉语词汇语音识别。实验结果表明,该方法对特定人二字汉语词汇语音的识别率可达96.8%,对非特定人二字汉语词汇语音的识别率可达98.8%,为解决汉语词汇整体语音识别提供了一种新的思路。  相似文献   

8.
以Xilinx公司Virtex-II Pro为开发平台,实现了一个基于隐马尔可夫模型(Hidden Markov Model,简称HMM)非特定人的孤立词语音识别系统.系统采用改进的基于语音对数域能量变化率的实时端点检测算法,仅对检测的有声段语音进行特征提取和解码,减少了要处理的语音帧数.实验表明系统在150词条的情况下识别率达到97.3%,识别时间为1.42倍实时.  相似文献   

9.
提出一种基于自组织神经网络的数字语音识别模型。首先用基于小波变换和线性预测的特征提取方法提取语音信号特征,用自组织神经网络进行识别判决。这种语音识别方法适合于小词汇量的孤立词识别,网络结构简单,所需训练数据十分的少,实时性能好。用MATLAB进行仿真实验,识别率达到98%。  相似文献   

10.
张晨燕  孙成立 《电信科学》2006,22(10):60-63
在SEED-DEC5502 DSP嵌入式系统开发平台上实现了一个面向非特定人的孤立词语音识别系统,与传统的基于特定人的语音识别系统相比,该系统无需用户训练,易于使用.系统采用改进的基于语音对数域能量变化率的实时端点检测算法,仅对检测的有声段语音进行特征提取和解码,减少了要处理的语音帧数;对状态输出概率计算进行了分析和优化,进一步降低了计算负担.实验表明系统在100词条的情况下识别率达到98%,识别时间为1.03倍实时.  相似文献   

11.
针对基于有监督学习通信信号分类算法需要大量有标签训练样本,而在实际场合大多无法满足数量要求的问题,提出利用数据驱动模型的半监督学习方法,通过对比预测编码无监督算法预训练和有监督学习相结合,利用LSTM (long short term memory)和ResNet (residual network)联合神经网络实现小样本自动提取特征,提高小样本条件下信号识别准确率。在真实通信调制信号集上实验表明,半监督联合神经网络结构较以往方法,识别准确率提升3%-20%,小样本条件下性能提高60%,同时在低信噪比条件下识别能力突出,0dB时对11种调制信号平均识别正确率达到92%,具有明显优势。   相似文献   

12.
 针对循环神经网络语言模型对长距离历史信息学习能力不足的问题,本文提出了结合全局词向量特征的循环神经网络语言模型。首先利用GloVe(Global Word Vectors)算法训练出全局词向量,然后将其作为特征向量输入到引入特征层的循环神经网络中进行训练。相对于局部词向量方法,全局词向量能够利用全局统计信息来训练出含有更加丰富的语义和句法信息词向量。为了验证新方法的性能,本文在Penn Treebank和Wall Street Journal语料库上分别进行困惑度和连续语音识别实验。实验结果表明结合全局词向量的循环神经网络语言模型的困惑度相比传统的循环神经网络语言模型降低了202%,同时语音识别系统的词错误率降低了183%。   相似文献   

13.
俞佳佳  金赟  马勇  姜芳艽  戴妍妍 《信号处理》2021,37(10):1880-1888
考虑传统语音情感识别任务中,手动提取声学特征的繁琐性,本文针对原始语音信号提出一种Sinc-Transformer(SincNet Transformer)模型来进行语音情感识别任务。该模型同时具备SincNet层及Transformer模型编码器的优点,利用SincNet滤波器从原始语音波形中捕捉一些重要的窄带情感特征,使其整个网络结构在特征提取过程中具有指导性,从而完成原始语音信号的浅层特征提取工作;利用两层Transformer模型编码器进行二次处理,以提取包含全局上下文信息的深层特征向量。在交互式情感二元动作捕捉数据库(IEMOCAP)的四类情感分类中,实验结果表明本文提出的Sinc-Transformer模型准确率与非加权平均召回率分别为64.14%和65.28%。同时与基线模型进行对比,所提模型能有效地提高语音情感识别性能。   相似文献   

14.
针对通信信号的自动调制识别需要大量特征提取的问题,提出了一种分离通道卷积神经网络自动调制识别算法。该算法通过结合深度学习中卷积神经网络(CNN),分别提取时域信号的多通道和分离通道调制特征,再利用融合特征实现不同信号的分类。仿真结果表明,相比基于CNN的算法,所提算法在高信噪比下针对两个数据集的识别率分别提升7%和18%;此外,相比于基于特征提取的传统识别算法,其高阶调制识别性能平均提升3 dB。  相似文献   

15.
冯玮  王玉德  张磊 《激光技术》2018,42(5):666-672
为了降低卷积神经网络计算的复杂度,改善特征提取过程中的过拟合现象,解决经典网络模型不能有效处理大尺寸图片的问题,采用了加权联合降维的特征融合与分类识别算法,根据两特征的识别贡献率对主成分分析法(PCA)降维处理和随机投影(RP)处理结果进行加权融合,然后将结果提供给卷积神经网络进行处理,提取图像分类的高层特征,使用欧氏距离分类器对识别对象进行分类,并进行了理论分析和实验验证。结果表明,经过加权联合降维对数据进行预处理,PCA矩阵与RP降维矩阵之比重达到6:4,识别率高达96%以上。该算法有效提高了准确率,使大尺寸图片在深度学习网络中有良好的识别效果,改善了网络的适应性。  相似文献   

16.
季伟  王力 《通信技术》2013,(12):15-18
语音识别系统中,语音的特征提取是语音识别的关键技术之一。通过对语音的系统研究,提出一种全新的基于流形学习的特征提取方法。流形算法是近些年才发展起来的非线性降维方法,在人脸识别领域已取得较好效果,但在语音识别领域一直处于空白。现提出的基于流形学习LPP算法的语音特征提取方案,是一次重大的尝试,可以为以后深入研究语音识别技术提供较好参考。仿真实验结果表明,该算法与传统特征提取LPCC、MFCC算法相比,可以取得较好的识别率。  相似文献   

17.
基于MFCC参数的说话人特征提取算法的改进   总被引:3,自引:0,他引:3  
张晶  范明  冯文全  董金明 《电声技术》2009,33(9):61-64,69
在说话人识别系统中,特征参数的提取对语音训练和识别有着重要的影响。对于特征参数提取模块,提出了一种新的特征参数提取算法MFCC_E(Efficient MFCC)。相对于标准算法MFCC_S(StandardMFCC),MFCC_E在特征提取模块部分减少了53%的计算量。最终实验结果说明MFCC_E的识别率为90.3%,仅比标准MFCC算法92.0%的识别率降低1.7%。因为MFCC_E算法的这种特点,使其能够更有效的适用于硬件实现。  相似文献   

18.
改进汉语数码语音识别中的语音特征提取性能   总被引:3,自引:0,他引:3  
汉语数据码语音识别中存在三种与语音特征提取性能有关的语音混淆。  相似文献   

19.
胡正平  陈俊岭  王蒙  孙哲 《信号处理》2017,33(6):845-854
特征提取作为模式识别中的重要步骤,一直是图像处理研究的重点,逐渐兴起的深度学习理论,作为一种新的深层特征提取模型,越来越受到广大学者的关注。本文提出一种基于深层融合度量学习的稀疏特征提取算法,在深度学习的框架内,构建度量映射矩阵,对图像进行分层映射,最大化保留样本集类间区分信息,并且通过稀疏迭代来保证特征提取结果的稀疏性。首先构建图像集距离度量函数,然后通过求解最大化类间距离来确定最优度量映射矩阵,同时对特征映射结果进行 范数稀疏迭代,提高噪声鲁棒性。然后对这个基本特征提取单元进行深度化改造,在第二层中进行同样的度量学习操作,最终通过多层融合提取得到分层深度稀疏特征。相对于已有子空间方法,本文在特征映射过程中引入度量自学习机制,并着重对各个特征映射层进行视觉合理性稀疏约束,融合多层特征语义描述生成最终特征提取结果。在FERET、AR、Yale等经典人脸数据库以及MNIST、CIFAR-10等目标数据库上的实验结果表明,该算法可以取得较高的识别率以及较好的光照、表情、人脸朝向鲁棒性,并且相对于卷积神经网络等深度学习框架具有结构简洁、收敛速度快等优点。   相似文献   

20.
郑明秋  杨帆 《液晶与显示》2017,32(3):213-218
为了提高人脸识别正确率,提出基于改进非负矩阵分解的神经网络人脸识别算法。首先利用改进的非负矩阵分解对人脸图像进行特征提取,提高非负矩阵分解速度。接着将提取出的特征信息作为神经网络学习入口进行特征训练,由于神经网络在学习过程中,容易出现局部最小值且收敛速度慢等问题,为此采用改进的遗传算法对神经网络进行优化处理,获得最终的人脸识别结果。实验结果表明:利用改进的非负矩阵分解方法能够降低神经网络的分类训练负荷量和运算量,提高人脸识别识别率。通过和各种方法比较可知,本方法的人脸识别率都较高。本方法人脸特征分解速度快,提高了神经网络训练前期精度和收敛速度,使得人脸识别正确率高。当特征向量个数达到40以上时,人脸识别正确率保持95%以上。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号