首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
详细介绍一种基于神经网络的自学习非特定人语音识别方法,首次介绍一种语音识别知识的自动检验方法——LVV法,给出系统原理图和知识库的自动完善原理;介绍一种LEA判别法,实现梯度牛顿有效结合神经网络快速学习方法,并给出了实验结果。  相似文献   

2.
针对基于深度神经网络的端对端的语音识别技术展开研究,通过深度全序列卷积神经网络(DFCNN)声学模型和Transformer语言模型搭建一种端对端的语音识别系统。该系统完成对模型及数据的训练,实现对多字符中文语音的识别,并对隐马尔可夫语音识别方法和深度神经网络下的语音识别方法的系统搭建难度、原理差异和识别精确度进行对比研究。仿真结果表明,所提方法能够实现对连续多字符中文语音的有效识别,识别正确率在90%以上。  相似文献   

3.
给出了一种应用于电话语音自动拨号的实时语音识别方法。该系统对特定人的语音进行识别,并将识别结果映射成相应的电话号码。实验结果表明该方法具有很高的识别精度和实时的识别速度,并且只需很小的内存空间就可以实现,是一种有效的应用于电话语音自动拨号等方面的语音识别方法。  相似文献   

4.
针对传统特定人语音识别过程中存在的算法复杂、所占存储空间大等问题,提出了一种改进的基于动态时间规整算法(DTW)的特定人语音识别系统.在对参数提取方法进行详细对比之后,提取美尔频率倒谱系数(MFCC)作为本系统的语音识别参数,有效的解决了人耳响应不同信号灵敏度不同的问题.利用MATLAB环境下语音工具箱Voice Box实现了对若干数字的孤立词识别,识别速度提高了约30%,识别成功率达到95%以上.仿真结果证明,该系统在算法简单,识别成功率高,是一种简单有效的语音识别方法.  相似文献   

5.
卢玮  姜晔 《电声技术》2001,(2):30-32
给出了一种应用于电话语音自动拨号的实时语音识别方法。该系统对特定人的语音进行识别,并将识别结果映射成相应的电话号码。实验结果表明该方法具有很高的识别精度和实时的识别速度,并且只需很小的内存空间就可以实现,是一种有效的应用于电话语音自动拨号等方面的语音识别方法。  相似文献   

6.
实际的研究表明,语音情感识别方法有多种.介绍了一种基于GMM的语音情感识别方法,包括该方法的优点、存在的问题或不足等,并对此进行了思考,给出了一些处理办法.  相似文献   

7.
周峰  俞一彪 《信号处理》2017,33(9):1215-1220
汉语数字语音之间的高混淆性直接影响了汉语数字语音识别的效果,传统的语音识别方法很难对易混淆的语音做出有效的区分。本文提出了一种多参数、多级识别策略,先采用MEL谱参数基于HMM进行初级数字语音识别,然后对易混淆的数字对采用一种新的群延时谱参数——RRCGD-CC(Reflected Roots Chirp Group Delay-Cepstral Coefficients)基于SVM进行二次分类。实验结果表明,通过多参数多级识别方法,数字“2”和“8”的识别率提高了8%,数字识别系统的整体识别率提高了2.3%。这一结果充分说明了本文提出的多参数多级识别方法有利于提高汉语数字语音识别系统的识别性能,同时也说明了RRCGD-CC在易混淆数字语音的识别上是有效的。   相似文献   

8.
特定人汉语数码语音抗噪识别方法   总被引:1,自引:0,他引:1  
本文提出一种连续隐邓尔可夫模型(CHMM)和人工神经网络(ANN)相结合的鲁棒性识别方法。用于噪声环境下特定人数码语音识别,该方法以CHMM的输出作为系统的识别矢量,利用人工神经网络的模式分类和自学习功能,从识别矢量空间中提取语音预识别矢量,再由识别结果进行识别输出。实验证明,这种基于CHMMANN的数码语音识别方法明显地提高了系统的噪声鲁棒性,适用于中小词表语音识别系统。  相似文献   

9.
语音接口     
本文讨论了NEC公司新近开发的语音接口系统。首先,给出了个人计算机的语音接口软件,该软件以NEC公司最新的语音识别和语音分析技术为基础。为了使语音识别适应于灵活多变的词汇并且不依赖于发话人,我们开发了以半音节单元为基础的识别方法。为实现高质量的文本——语音的转换,我们开发出一种混合了波形连锁方法与新的韵律产生模型的新方法。此外,还提出了语音对话系统的研究原型,其目的是为了在多媒体环境下实现与信息服务系统的自然语音对话。  相似文献   

10.
介绍了一种基于专用语音编码/解码芯片AMBE-1000的双路语音采集系统,并给出了详细的硬件电路设计方法和软件流程.  相似文献   

11.
 本文研究运用矢量码书和动态内插限制的方法解决语音生成逆向解的非唯一性问题.表征声道的对数截面积函数的限带傅立叶余弦展开包括了偶次项,采用可变声道长度;频域声学目标增加了前N个零点频率;结合腔包形声学——几何形态映射矢量码书,为声学目标匹配得到过渡音的起始和结尾端点的零点与声道长度,并用内插方法来限定过渡点的零点频率和声道长度,从而解决非唯一性问题.计算机仿真实验表明了本方法的有效性.  相似文献   

12.
吴愚  方元 《电声技术》2009,33(2):52-54
首先总结了几种常见的语音活动检测(VAD)方法,然后从计算每帧每个频率点的语音存在概率出发.提出了一种新的VAD方法,并就其中的一些参数选择问题进行了讨论。最后给出新方法与传统方法实验结果对比。  相似文献   

13.
许多高品质语音芯片的音效很好,但常常因为处理的数据量大、信号不便传输,对方便实用的语音系统的开发带来了困难。文中提出一种易于在单片机和高密度可编程器件组成的系统上实现语音处理新方法,较好地完成语音信号的压扩编解码与语音信号的叠加。实践证明这是一种开发多功能语音处理系统中性价比较高的方法。  相似文献   

14.
关海欣  曾庆宁 《电声技术》2007,31(2):60-62,66
提出了基于子空间语音增强与基于小波语音增强相结合的语音增强方法,克服了仅用子空间方法和仅用小波方法各自的弊端,并充分利用了两者的优点。实验结果表明,恢复后的语音不仅失真较小,而且更大程度上抑制了噪声,有效去除了音乐噪声。  相似文献   

15.
耳语音识别可应用于国家安全的某些特殊需要。运用双门限法对语音样本进行端点检测,通过实验分别找出短时能量、短时过零率的高低门限4个参数的最佳取值。深入分析研究参数的抗噪问题,在MFCC参数中引入短时能量、一阶差分、二阶差分等参数,增强MFCC的抗噪性。研究表明,在隐马尔可夫模型中,MFCC和LPCC联合运用讨论识别效果要远优于独立参数。  相似文献   

16.
陈斌  牛铜  张连海  屈丹  李弼程 《电子学报》2016,44(12):2924-2931
为了提高基于分帧特征变换方法的稳定性,提出了一种基于分段的区分性特征变换方法.该方法将特征变换当成高维信号的稀疏逼近问题,采用状态绑定的方法训练得到基于域划分的线性变换矩阵(Region Dependent Linear Transform,RDLT)和基于最小音素错误准则均值补偿的特征(mean-offset feature Minimum Phone Error,m-fMPE)变换矩阵,将两者的特征变换矩阵构成过完备的字典;采用强制对齐的方式对语音信号进行分段,以似然度最大化作为目标函数,利用匹配追踪算法对目标函数迭代优化,自动地确定各语音信号段中的变换矩阵及其系数.为保证特征变换的稳定性,在选择变换矩阵过程中引入相关度测量,去除相关的特征基矢量.实验结果表明,相比于传统的RDLT方法,当声学模型分别采用最大似然和区分性准则训练时,识别性能分别可以提高1.63%和2.23%.该方法同时能应用于语音增强和模型区分性训练中.  相似文献   

17.
邹霞  吴其前  张雄伟 《信号处理》2007,23(2):195-199
本文提出了一种新的基于Laplacian语音模型的语音增强算法。首先,在假定语音和噪声的短时DCT系数分别服从Laplacian和Gaussian分布的基础上,推导了最小均方误差意义下的语音信号短时DCT系数估计;然后,根据语音存在概率估计,提出了语音信号短时DCT系数估计的修正因子。在增强算法中,提出了面向判决的Laplacian语音模型参数估计和基于Laplacian语音模型的改进最小量控制递归平均(IMCRA)噪声估计算法。仿真结果表明,本文算法不仅在噪声抑制性能方面优于近两年国际上提出的几种基于Gaussian语音模型的语音增强算法,而且在增强语音质量方面也具有更好的性能。  相似文献   

18.
低信噪比条件下的一种自适应有声/无声判决算法   总被引:14,自引:0,他引:14  
本文描述了一种利用含噪语音短时能量进行有声/无声判决的自适应算法。通常,利用短时能量进行有声/无声判决时,均采用一固定门限,但是,恰当的判决门限显然是噪声统计特性及信号能量的函数。本文提出了一种估计含噪语音短时能量概率密度函数,并根据所期望的误判率估计判决门限的算法。本算法无需预先给出噪声统计信息,且适用于缓变的非平稳噪声情况。  相似文献   

19.
提出了语音信号的快速实值离散Gabor变换(RDGT)方法,讨论了由RDGT系数计算语音复谱图值、语谱图生成和语音信号的快速重建问题。并给出了实例。  相似文献   

20.
李天伟  李正友  黄谦  郭姣 《通信技术》2015,48(7):803-807
把语音信号分解为确定和随机两部分是非常典型的语音信号分析与合成方法。针对目前主流研究的谐波加噪声模型(Harmonic plus Noise Model, HNM)和准谐波模型(Quasi-Harmonic Model, QHM)法等存在冗余大的问题,提出了一种基于谱跟踪和噪声模型的语音信号分析/合成方法。以音素为基本单元进行编解码,用谱跟踪法提取时变特征合成语音信号的确定部分,用AR模型合成语音信号的随机部分。实验发现,合成语音与原语音波形上比较接近,MOS分约为3.24,冗余也明显减少。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号