首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
为了解决连续的语音识别对端点的依赖性问题,提出了一种基于高维空间点覆盖动态搜索理论的非特定人问候语连续语音识别的新算法,该算法无需对待识别连续语音进行端点检测和分割,通过直接对特征提取后的连续语音进行动态搜索,得到待识别连续语音到各类训练网络的距离随时间变化的曲线,通过动态搜索距离曲线上谷值的大小来判断识别结果.通过对小词汇量、不同语速条件下的连续语音的测试,得到了良好的识别结果,验证了此方法的有效性.  相似文献   

2.
本文介绍了连续语音识别中噪音鲁棒性方法的现状,分析传统动态范围调整方法在连续语音识别中导致的特征曲线中的峰值不匹配问题,提出了新的特征曲线调整算法,并为算法的参数设定增加了限制条件。本文详细地论述了算法的步骤以及算法中参数的确定。通过理论分析和实验验证,证明了提出的算法在连续语音特征调整中具有很好的性能,提高了识别精度。  相似文献   

3.
仿生模式识别基本原理应用到非特定人连续语音识别中,在构建语音模型时,将高维空间点覆盖的理论应用到非特定人的连续语音识别的学习过程中,在识别时,采用高维空间覆盖动态搜索的方法,对连续语音进行动态搜索,这样就可以避免因分割错误而带来的错误识别.通过实验得到了较为满意的识别结果。  相似文献   

4.
针对孤立词语音识别系统设计一个改进的系统。该系统通过维纳滤波滤除噪声得到估计语音,对该语音进行双门限端点检测和特征提取得到端点范围内的特征向量,采用改进动态时间规划算法计算该特征向量与模板特征向量之间的欧式距离得到识别结果。仿真对比实验结果表明,改进系统在识别效果和识别效率方面有提高。  相似文献   

5.
彝语的语音识别与处理是语音信号处理领域的一个新方向.本文在深入分析彝语特点的基础上,对用于汉语孤立词识别的经典端点检测算法进行了改进.探讨了动态时间规整算法(Dynamic Time Warping,DTW)和高效动态时间规整算法(Efficient DTW,EDTW)在彝语孤立词识别中的应用,并提出了两种新算法:基于音节个数的动态时间规整算法(Syllable Number Based Improved DTW,SDTW)和基于音节个数的高效动态时间规整算法(Syllable Number Based Improved EDTW,SEDTW),对特定的彝语语音信号进行识别.实验结果表明,所提出的两种新算法分别在信号识别率和识别时间上比经典算法优越.  相似文献   

6.
针对现有关键词识别系统采用很难用硬件电路准确描述的连续隐马尔可夫模型CHMM作为识别模型,提出用离散隐马尔可夫模型DHMM作为系统的识别模型,研究了适用于硬件实现的状态机端点检测算法,并通过引入VQ矢量量化模块来保证离散关键词识别系统的识别率和识别速度;根据关键词训练模型,分析所采集语音信息中是否存在指定的关键词并进行准确识别。实验结果表明,该算法在便于硬件实现的基础上,具有良好的识别率和实时性,为关键词识别系统的FPGA硬件电路实现研究提供了参考。  相似文献   

7.
针对非特定人大词汇量连续语音识别,在均值方差归一化的基础上,提出了基于动态阈值的特征调整方法。动态阈值的选取方式包含阈值的动态范围确定和确定阈值的系数。动态阈值范围的确定依据如下两个数值,一个是样本特征点的均值,另一个是使得样本特征点等分的数值。然后再根据对特征点在样本特征点均值上下的比例关系得到系数,最后根据这个系数来确定一个具体的阈值,并基于此阈值对连续语音特征曲线进行调整。  相似文献   

8.
为了识别一组非特定人、不连续的数字语音信号,本文提出了一种基于支持向量机理论的语音信号识别算法.具体过程主要包括训练过程和识别过程.其中训练过程为:先使用预先建立起来的语音库对选定的支持向量机进行训练,得到一组与该语音信号相关的支持向量;在识别过程中,首先获取被测语音信号,并根据MFFC理论提取特征向量,然后使用训练后的支持向量机进行识别.此外,还提出使用短时区域能量谱的方法对语音信号进行端点检测.结果表明,与目前流行的隐马尔可夫算法比较,本文算法具有识别速度快、准确率高等优点.  相似文献   

9.
连续语音识别中,由于各声学单元之间没有明显的间隔或声学标志,匹配和搜索算法成为影响系统实时性能的核心问题。基于汉族语音的特点,提出了一种改进的N-Best搜索算法。该算法大大降低了传统N-Best程序搜索空间而不至于失去最优解,有利于算法的实时实现。  相似文献   

10.
在汉语大词汇量连续语音识别中,以往基于最大后验概率准则解码得到的识别结果具有最小的句子错误率,为了得到字错误率最小的识别结果,可以采用最小贝叶斯风险解码策略,通过将识别输出的word lattice转换成为混淆网络以得到最小字错误率的识别结果。在以往混淆网络算法的基础上,根据汉语语言的特点,提出一种改进的构造混淆网络的算法。基于863测试语音库进行的实验表明,与最大后验概率识别结果和以前的两种混淆网络算法的识别结果相比,改进的混淆网络算法有效地降低汉语大词汇量连续语音识别结果的字错误率。  相似文献   

11.
分析描述了字符识别的各类方法,总结了目前流行的基于结构的识别方法和基于统计的识别方法,分析了它们的优缺点,针对目前尚不成熟的脱机手写字符识别,分析了手写字符识别的特点及其它与印刷体字符识别的区别,探讨了手写字符特有的噪声等影响识别的因素和对应的识别方法,并对这一领域今后的研究方向提出了自己的看法。  相似文献   

12.
为了解决低质量虹膜图片识别效果不好的问题,提出了一种基于分块的虹膜识别算法。该方法并不像常规算法一样对整个图片进行识别,而是首先将虹膜区域均等地分割为无重叠的分块,然后对每一个分块提取低秩矩阵作为特征,接着使用稀疏分类器进行分类,最后依据稀疏浓度指数,将各分块识别结果进行贝叶斯融合,由于虹膜图片不同区域的质量不一样,该方法能够降低质量不好的虹膜区域对最终识别结果的影响。在标准虹膜数据库CASIA-Iris-Interval 和 IIT Delhi V1上的实验结果显示该算法拥有较高的正确识别率,且对于低质量的虹膜图片具有较强的鲁棒性,对分块和训练图片数量的研究表明,将虹膜区域分为8个分块较为合适,使用7张训练图片就能够很好的表示一类。  相似文献   

13.
机号识别若干问题的研究   总被引:1,自引:0,他引:1  
以摄像机,图像采集卡和计算机为重要技术手段,综合运用图像处理与模式识别技术,给出了一个飞机号码识别系统,该系统应用于空军某飞机场的自动加油系统,重点讨论了飞机机号识别的3个关键技术,二值化与图像分割,特征抽取以及号码识别。  相似文献   

14.
分析描述了字符识别的各类方法,总结了目前流行的基于结构的识别方法和基于统计的识别方法,分析了它们的优缺点,针对目前尚不成熟的脱机手写字符识别,分析了手写字符识别的特点及其它与印刷体字符识别的区别,探讨了手写字符特有的噪声等影响识别的因素和对应的识别方法,并对这一领域今后的研究方向提出了自己的看法.  相似文献   

15.
乐音中的基音成分是进行乐音分析的重要参数,使用小波分解可以比较清晰地反映基音周期情况,FFT对于周期信号有精确的频域分辨.利用小波在信号低频分解方面的良好性质,提出了小波分解的基音检测方法,并用优化的FFT方法获得基音频率的精确定位.在实际开发的系统中取得了较好的效果.  相似文献   

16.
乐音旋律识别研究   总被引:1,自引:0,他引:1  
乐音中的基音成分是进行乐音分析的重要参数,使用小波分解可以比较清晰地反映基音周期情况,FFT对于周期信号有精确的频域分辨.利用小波在信号低频分解方面的良好性质,提出了小波分解的基音检测方法,并用优化的FFT方法获得基音频率的精确定位.在实际开发的系统中取得了较好的效果.  相似文献   

17.
18.
基于Trace变换的步态识别算法   总被引:4,自引:0,他引:4  
提出了基于Hu矩的步态周期检测算法,该算法具有尺度、平移不变性,在预处理的标准中心化之前进行,缩短了步态识别前期处理工作的时间,为实时的步态识别提供可能。在分析步态的投影特征具有身份判别的能力之后,进而引出并说明使用Trace变换特征对步态表达的想法是合理的。提出基于Trace变换的步态识别算法,详细地讨论了三种Trace变换的泛函形式,在CASIA(B)步态库上进行验证实验,最佳识别率可达84.14%。这种方法避免了动态时间规整以及线性时间归一等算法的复杂的调整过程。  相似文献   

19.
为解决脑电(electroencephalogram, EEG)情绪识别这一项具有挑战性的任务,提出一种基于双向长短时记忆网络(bidirectional long short-term memory, Bi-LSTM)的脑电情绪分类模型并探索大脑情绪机制,唤醒度准确率最高为76.78%,效价度准确率最高为77.28%,与其他模型比较,Bi-LSTM模型在脑电情绪识别上有出色的表现。通过Bi-LSTM模型对比不同频段、脑区和特征疏密度的准确率来探索大脑情绪机制,表明大脑中情绪相关性最高的频段、脑区和特征疏密度分别为α和β、顶叶区与额叶区、50和15。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号