首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 125 毫秒
1.
在LABVIEW平台上,通过声卡获得语音信号,设计了以美尔频率倒谱系数及其差分作为语音识别的特征参数,通过动态时间规整算法来识别的与文本有关的说话人辨认系统.  相似文献   

2.
为了识别一组非特定人、不连续的数字语音信号,本文提出了一种基于支持向量机理论的语音信号识别算法.具体过程主要包括训练过程和识别过程.其中训练过程为:先使用预先建立起来的语音库对选定的支持向量机进行训练,得到一组与该语音信号相关的支持向量;在识别过程中,首先获取被测语音信号,并根据MFFC理论提取特征向量,然后使用训练后的支持向量机进行识别.此外,还提出使用短时区域能量谱的方法对语音信号进行端点检测.结果表明,与目前流行的隐马尔可夫算法比较,本文算法具有识别速度快、准确率高等优点.  相似文献   

3.
目的研究用自然语言向智能家居系统进行信息输入和对相关设备的控制及语音识别控制器设计.方法通过对语音信号特点和识别技术的分析,对语音识别系统的语音特征提取、声学模型与模式匹配、语言模型与语言的处理,阐述了HMM算法和DP匹配的语音识别算法,指出孤立词识别系统结构的特点.结果利用TSG110芯片,给出语音识别控制器的识别技术和系统硬件结构、软件设计及组成方法.结论语音识别技术运用于智能家居系统的语音识别控制器,使其具有语音分析、识别和系统控制等功能,实现信息输入与控制.  相似文献   

4.
语音情感识别作为一个新的研究热点,因其能解决教育中情感缺失的问题,而越来越受到研究者的重视.选取符合人类听觉系统感知的M el频率倒谱系数(MFCC)与各态历经型的连续隐马尔可夫模型(CHMM)进行语音情感特征的分析,并对大量的语音信号进行情感识别实验,识别正确率达到86.7%,为教育中的情感补偿提供了切实可行的依据.  相似文献   

5.
中科院声学所在音频信号处理及人机互动界面语音处理领域取得一系列重要技术成果,并已成功商用。其最新技术涵盖广泛.在音频及语音信号处理领域.包括语音信号的监测、增强.智能声场控制和音频回放技术;在人机互动技术领域,包括语音输入处理任务和音频内容检索等.例如在汽车内等嘈杂环境.能有效抑制噪声、消除回声.实现清晰通话;通过语音识别技术真正实现“闻其声如见其人”的效果。  相似文献   

6.
针对语音信号振幅较大时传统压缩算法的跟踪性较差的情况,提出了一种新型的改进型自适应ADDPCM语音压缩算法.同时,根据语音信号不连续的特点,压缩算法具有静音识别功能,进一步提高了语音信号的压缩率.压缩算法在8kHz的A/D采样速率下,将实时传输和处理的语音数据减少到了3kb/s的数据流量,并且解码后的语音恢复信号具有良好的可懂度和较高的语音能量,取得了良好的语音压缩效果.在语音信号压缩算法研究的基础上,利用片上系统单片机C8051F005实现了语音信号的压缩编码和解码,并进行了效果的比较.实验表明,该语音压缩算法有效降低了编码率,提高了传输带宽的利用率,并且恢复的语音信号在振幅较大时取得较好的动态跟踪效果.  相似文献   

7.
一种改进的基于短时能量的端点检测算法   总被引:1,自引:0,他引:1  
为了提高语音识别的实时性和识别率,采用动态窗长短时能量进行语音信号的端点检测方法.比对传统短时能量短时平均过零率端点检测方法,通过实验得到的端点检测波形图像及数据证明,动态窗长短时能量方法可以减少不必要的语音帧的处理,提高识别的速度和识别率.  相似文献   

8.
基于MATLAB GUI的语音信号特征提取系统设计   总被引:1,自引:0,他引:1  
语音信号的典型时频特性和核心处理算法是语音识别、合成和说话人识别等系统中的关键问题.结合线性预测分析技术(LPC)和美尔倒谱参数(MFCC)的算法原理,基于MATLAB GUI技术,设计完成了语音信号典型特征提取系统的界面平台,可实现语音信号的装载、播放和波形显示,LPC和MFCC的计算结果显示和数据存储等功能.界面的人机交互性好,操作简单方便,可提高对算法或数据处理效果的直观认识,对语音信号分析和处理等各个研究领域具有重要的现实意义.  相似文献   

9.
基于帧能量参数和帧与稳态背景噪声状态之间的失真度,将连续的电话频带汉语语音信号分割至用隐马尔可夫链模型表示的以字为单位的语音,采用动态时间规正算法和最小失真度准则,作以字为单位的语音识别,从而实现连续语间识别。实验表明电话频带连续语音识别正确率达75%。  相似文献   

10.
针对气力输送管道中测控装置后常见的三种过渡流型,即中心流、环状流和层状流,采用静电传感器作为测量装置获得静电流动噪声信号,借鉴语音信号处理方法,提取静电流动噪声信号的梅尔频率倒谱系数(MFCC)及其一阶差分作为特征参数,用特征参数训练连续高斯混合密度隐马尔科夫模型(CGHMM),建立不同流型的模型库,再用训练好的CGHMM模型对提取的特征参数进行分类,进而实现流型识别.实验结果表明,该方法识别率达到98%,为气固流流型识别及气力输送测控装置提供了新的研究方法.  相似文献   

11.
仿生模式识别基本原理应用到非特定人连续语音识别中,在构建语音模型时,将高维空间点覆盖的理论应用到非特定人的连续语音识别的学习过程中,在识别时,采用高维空间覆盖动态搜索的方法,对连续语音进行动态搜索,这样就可以避免因分割错误而带来的错误识别.通过实验得到了较为满意的识别结果。  相似文献   

12.
基于HMM/ANN混合模型的带噪语音识别   总被引:1,自引:0,他引:1  
对于含噪语音信号的有效特征提取是语音识别至关重要的一步.该文提出了利用小波调制尺度对语音进行特征提取,结合隐马尔可夫和人工神经网络混合模型进行识别的方法,可进一步反映语音信号的动态特性、增强抗干扰能力和提高识别率.实验证明,该模型适合于对噪声背景下的语音进行识别,同传统的HMM模型相比,具有更好的抗噪鲁棒性,在信噪比较低情况下,识别率比传统的HMM模型有明显的提高.  相似文献   

13.
本文介绍了连续语音识别中噪音鲁棒性方法的现状,分析传统动态范围调整方法在连续语音识别中导致的特征曲线中的峰值不匹配问题,提出了新的特征曲线调整算法,并为算法的参数设定增加了限制条件。本文详细地论述了算法的步骤以及算法中参数的确定。通过理论分析和实验验证,证明了提出的算法在连续语音特征调整中具有很好的性能,提高了识别精度。  相似文献   

14.
为解决语音识别过程中的抗噪声及抗干扰问题,提高系统的识别精度,利用隐马尔可夫模型HMM优异的时序建模能力及小波变换可以对信号进行多尺度分析并有效提取信号的局部信息的特点,建立了混合语音识别模型.考虑到在语音信号识别过程中信号的非平稳性,采用并行的识别方法分别获取分类信息,根据混合模型的识别算法做出识别决策,减小了系统对环境的依赖性,提高了其自适应能力.仿真实验结果表明,混合模型识别结果比单一HMM模型或小波模型识别结果更佳,提高了整体的识别速度和识别率.  相似文献   

15.
语音信号的端点检测是语音识别过程中的重要环节,端点检测结果精确与否直接关系着语音识别的准确度。使用车载语音作为测试数据,利用传统双门限法进行端点检测,发现传统双门限方法在静音条件下和带噪条件下获得语音端点检测信息存在较大误差。针对上述问题,提出了一种改进的双门限法进行语音端点检测,针对语音信号以及短时平均能量和过零率进行处理,并通过Matlab进行仿真,实验结果说明提出的改进方法与传统方法相比,在静音和带噪条件下,都更接近测试数据中真正的语音端点。  相似文献   

16.
针对语音识别过程中环境噪声干扰大的问题,提出一种基于经验模态分解(EMD)与动态时间规整 (DTW)相结合的孤立词识别算法。该方法利用EMD 算法,首先将提取的性能不好的语音信号分解成若干个基本模函数(IMF),去掉原始信号中的干扰和噪声。然后,基于DTW 算法,采用短时过零率和短时能量对语音信号进行端点检测,提取语音特征参数后与参考模板进行匹配。将参考模板与待测模板之间的最短路径作为识别结果。仿真结果表明,该算法能够提高语音的识别效率和识别的正确率。  相似文献   

17.
在汉语大词汇量连续语音识别中,以往基于最大后验概率准则解码得到的识别结果具有最小的句子错误率,为了得到字错误率最小的识别结果,可以采用最小贝叶斯风险解码策略,通过将识别输出的word lattice转换成为混淆网络以得到最小字错误率的识别结果。在以往混淆网络算法的基础上,根据汉语语言的特点,提出一种改进的构造混淆网络的算法。基于863测试语音库进行的实验表明,与最大后验概率识别结果和以前的两种混淆网络算法的识别结果相比,改进的混淆网络算法有效地降低汉语大词汇量连续语音识别结果的字错误率。  相似文献   

18.
为构造有效的情感识别系统,通过声音刺激分别诱发出高兴、悲伤、生气以及中性4种情感,并采集相应的语音信号和脑电信号。首先,利用相空间重构技术提取脑电信号和语音信号的非线性几何特征和非线性属性特征,并结合两者的基本特征分别实现情感识别;然后,通过构建基于限制玻尔兹曼机的特征融合算法,从特征层融合的角度实现多模态情感识别;最后,利用二次决策算法从决策融合的角度构建多模态情感识别系统。实验结果显示,从特征融合的角度构建的多模态情感识别系统相比语音信号和脑电信号情感整体识别率,分别提高1.08%和2.75%;从决策融合的角度构建的多模态情感识别系统相比语音信号和脑电信号情感整体识别率,分别提高6.52%和8.19%;决策融合相比特征融合构建的多模态情感识别系统整体识别效果更优。因此,融合语音信号和脑电信号等不同来源的情感数据可以构造出更有效的情感识别系统。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号