首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 711 毫秒
1.
线性预测编码技术及其在G.729中的应用研究   总被引:1,自引:0,他引:1  
线性预测编码(LPC)技术是一种重要的语音信号处理技术,广泛地应用在估计基本的语音参数等方面.详细介绍了线性预测编码技术的原理以及三种基本实现算法,并着重研究了LPC技术在G.729语音编码标准中的应用,最后采用仿真工具MATLAB对语音信号进行LPC分析,验证了LPC是对语音信号谱进行估计的一种有效方法.  相似文献   

2.
应用连续隐马尔可夫模型(CHMM)为识别算法,采用MFCC(MEL频率倒谱系数)为主要语音特征参数,建立了一个汉语连续数码串语音识别系统,其中包括语音信号的预处理、特征参数的提取、识别模板的训练以及识别匹配算法,文中就系统的各个部分的具体实现进行了阐述.同时,利用MATLAB的语音工具箱voice box对系统进行了仿真,并给出了系统识别结果,指出了系统进一步改进的方法.  相似文献   

3.
提出了一种基于平均路径长度的语音识别算法.采用的识别方法属于小词汇量孤立词语音识别,主要包括端点检测、特征提取和模式识别.首先,在对语音信号预处理的基础上,采用梅尔频率倒谱系数(MFCC)为特征参数提取算法,动态时间规整(DTW)作为识别算法;然后,结合基于平均路径长度的模板训练方法,即采用少量样本,通过计算平均路径长...  相似文献   

4.
用希尔伯特-黄变换(HHT)对语音信号进行处理,由此提取语音特征参数.针对单一说话人识别方法的局限性,基于VQ分类器的工作原理,以缩小类集合规模为出发点,结合信息融合理论提出了基于串联方式的二次判决融合系统.实验表明,该融合系统较独立MFCC(Mel Frequency Cepstrum Coefficient)判决系统有更好的识别效果.  相似文献   

5.
目的研究用自然语言向智能家居系统进行信息输入和对相关设备的控制及语音识别控制器设计.方法通过对语音信号特点和识别技术的分析,对语音识别系统的语音特征提取、声学模型与模式匹配、语言模型与语言的处理,阐述了HMM算法和DP匹配的语音识别算法,指出孤立词识别系统结构的特点.结果利用TSG110芯片,给出语音识别控制器的识别技术和系统硬件结构、软件设计及组成方法.结论语音识别技术运用于智能家居系统的语音识别控制器,使其具有语音分析、识别和系统控制等功能,实现信息输入与控制.  相似文献   

6.
采用模式匹配的识别技术,建立孤立词语音识别系统,基于MATLAB环境对0~9这10个数字语音进行仿真实验.在提取MFCC的基础上,整合差分倒谱参数作为语音的特征参数,并对现有的DTW算法加以改进,节省了系统匹配的计算时间,使其具有一定的鲁棒性.分别采集普通话语音和湖北、闽南、安徽3地方言的语音数据,体现了数据的完备性和系统的适用性.实验结果表明,基于改进型DTW算法和MFCC的语音识别系统具有较高识别率,取得了良好效果.  相似文献   

7.
提出一种新型的神经网络线性预测编码算法.针对目前自相关法存在着预测系数解误差以及协方差法存在解不稳定的缺点,算法利用最小均方准则思想显著提高了短时平均误差精度.通过窄带信道将低速率语音编码远距离传输是多媒体语音技术中的重要研究内容,采用语音信号压缩处理是解决低速率传输的有效方法之一,而线性预测编码(LPC)技术是语音压缩参数编码技术的重要内容.从线性预测编码技术入手分析和研究LPC编码技术的原理,阐述了利用最小均方准则思想来提高短时平均误差精度的方法,并介绍了预测系数的自相关求法.最后通过语音合成实验验证了该新型算法既提高了系数解的精度,又保证了系统的稳定性.在该算法下预测系数的均方误差比传统的自相关法误差减小20%以上,而且当原始信号频率较高时语音合成的效果更明显,将更加精确地复现原始语音信号.  相似文献   

8.
针对包含环境噪声和信道失真等噪声的语音处理问题,提出了一种基于自适应心理声学模型的智能语音识别系统,并建立了听觉模型.该模型将心理声学和耳声发射(OAE)合并到了自动语音识别(ASR)系统中,利用AURORA2数据库分别在清洁训练条件和多训练条件下进行试验.结果表明,所提出的特征提取方法可以显著提高词识别率,优于梅尔频率倒谱系数(MFCC)、前向掩蔽(FM)、侧向抑制(LI)和倒谱平均值及方差归一化(CMVN)算法,能够有效地提高智能语音识别系统的性能.  相似文献   

9.
利用矢量量化的说话人识别系统的研究   总被引:2,自引:0,他引:2  
利用矢量量化(VQ)技术实现了与文本有关的说话人识别。系统采用语音信号的LPC倒谱系数、差值倒谱系数、基音周期和差值基音周期的混合特征参数作为识别的特征矢量集,对语音库中语音的平均识别率达到了92%,实时识别率达到90%以上。实验结果表明该系统具有识别精度高、速度快等特点,是一种有效的说话人自动识别的实现方法。  相似文献   

10.
特征提取是说话人识别系统中的一项关键技术,讨论了在说话人识别中语音特征的提取,详细介绍了求取MEL倒谱系数MFCC和线性预测倒谱系数LPCC的具体步骤和算法,并对MFCC和LPCC语音特征参数做出了理论分析和实验数据比较,通过实验论证了对于低频语音,采用MFCC参数的说话人识别在屏蔽噪音和抗噪声能力都优于采用LPCC参数的说话人识别.  相似文献   

11.
为了减少语音识别时间,降低系统资源耗费,提出一种针对非特定人、孤立词、大词汇量的语音分组识别算法.运用K均值聚类算法对语音分组,并对语音分组特征进行置信度检验,使分组稳定,保证分组后识别率不下降.通过对非特定人孤立词的语音识别的实验,证实了该方法的有效性.  相似文献   

12.
语音识别和控制环境中,非语音信号(噪音)很容易与语音信号相混淆,一部分噪音被机器误认为语音,导致系统性能恶化.针对这一问题,以说话人识别理论为基础,提出了一种采用矢量量化来对音频信号类型(噪音或语音)进行确认的方法,以便于后期对非语音信号的噪音进行鉴别并且予以消除,提高语音信号处理系统的工作效率.在此基础之上,在MATLAB平台上设计了一个基于此方法的语音与非语音识别的仿真系统.测试结果表明,系统实现了语音与非语音识别的基本功能,达到较好的工作效果.  相似文献   

13.
为满足对室内定位技术和系统应用平台的迫切需求,提出一种基于超声波的室内三维定位系统,阐述了其工作原理并对三边定位算法进行了研究。该系统基于射频和超声波传感器的固有性质,对超声波信号采用CDMA(Code Division Multiple Access)技术进行编码,以便在目标节点上区分每个信标发来的超声波信号,并结合射频信号实现TDOA(Time Difference Of Arrival)测距算法,最终实现三维定位。实验研究表明,以一个信标为原点,另外两个信标分别放置为X轴和Y轴上,建立三维坐标系,能简化三边定位算法,并能实现精度较高的三维定位。  相似文献   

14.
基于TMS320C5509 DSP的语音处理系统平台硬件设计   总被引:1,自引:0,他引:1  
语音信号的处理的关键技术是数字信号处理,文章结合数字信号处理技术,进行了语音处理系统的研究,并设计了一种基于DSP的语音处理系统。该系统主要以TI公司的DSP芯片TMS320C5509作为处理核心,以数字形式对信号进行采集、变换、滤波等处理,得到了符合需要的通用语音信号处理的硬件平台。  相似文献   

15.
为满足在嵌入式系统上实现非特定人的语音识别需求,介绍一种采用离散隐马尔科夫模型(DHMM)的嵌入式语音识别系统的实现方法.设计出一种在嵌入式系统上完成语音识别功能、在PC系统上完成模板训练功能的软件架构.针对TMS320VC5509A处理器的特点,对识别软件进行实现和优化.根据语音信号不可逆的特点,提出一种优化的viterbi算法.实验结果表明,在保证识别率的条件下系统取得了200ms以内的实时响应速度,具有很高的实用性.  相似文献   

16.
在虚拟仪器开发软件LABVIEW平台上,利用LABVIEW和MATLAB混合编程,通过声卡获得原始语音信号,经过小波消噪处理、预加重处理和端点检测处理得到干净的语音信号,提取语音信号的美尔频率倒谱系数及其一阶、二阶差分系数作为语音识别的特征参数,通过矢量量化(VQ)与隐马尔可夫模型(HMM)实现非特定人连续语音的训练与识别,构建了基于LabVIEW平台的连续语音识别系统.实验表明,系统的识别速度较快,识别率达到90%左右,而且成本比较低廉,具有一定的应用价值.  相似文献   

17.
针对语音识别过程中环境噪声干扰大的问题,提出一种基于经验模态分解(EMD)与动态时间规整 (DTW)相结合的孤立词识别算法。该方法利用EMD 算法,首先将提取的性能不好的语音信号分解成若干个基本模函数(IMF),去掉原始信号中的干扰和噪声。然后,基于DTW 算法,采用短时过零率和短时能量对语音信号进行端点检测,提取语音特征参数后与参考模板进行匹配。将参考模板与待测模板之间的最短路径作为识别结果。仿真结果表明,该算法能够提高语音的识别效率和识别的正确率。  相似文献   

18.
语音识别技术可以为要求双手同时作业的操作人员和残疾人提供一种便捷的控制方法。作者在文中提出了一种通过结合二阶频率滤波和RASTA技术来增强语音识别鲁棒性的方法,并将这种方法成功应用于机器人化护理床的控制系统中,增强了识别系统在医院、工厂等非稳定噪声环境下语音识别的鲁棒性。通过将HMM/GMM混合模型的传统Mel频率倒谱系数为特征值的识别系统与HMM/GMM混合模型的RASTA-FF2为特征值的识别系统进行比较,并分别在纯语音和带噪语音条件下进行测试,发现经过二阶频率滤波后的FF2特征值再经过RASTA滤波器滤波,特别是在非稳定噪声环境下,以RASTA-FF2为特征值的识别系统比传统的识别系统的识别率更高,这表明FF2特征值与RASTA滤波器技术相结合,一个作用于频域,一个作用于时间域,可以有效地消除语音信号中的不同噪声成份。  相似文献   

19.
基于DSP的语音识别系统的设计与实现   总被引:2,自引:0,他引:2  
一种基于定点数字信号处理器TMS320VC5402的实时语音识别系统。能够实现非特定人、小词汇表、孤立词的语音识别。系统以线性预测倒谱参数为特征参数,采用动态时间归整识别模型,在小词汇量特定人条件下,该系统的正识率可达到98%以上,在非特定人情况下正识率在93%以上。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号