首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 137 毫秒
1.
汉语语音识别研究面临的一些科学问题   总被引:12,自引:0,他引:12  
杜利民  侯自强 《电子学报》1995,23(10):110-116,61
本文简述汉语语音自动识别从实验室技术过渡到实际商用技术所必须解决的一些科学问题,列举了汉语语音编码的结构特点和规则,强调(1)在汉语音节的声母、韵母层面上的语言模型对语音的识别很有帮助,也会提供文字语言和讲话语言的有用知识;(2)使用区别性导引特征和描述性均匀特征有助于加速语音识别的搜索速度,减少失配和改善对音位变体的细分,本文还着重讨论了在语音信号的声学处理环节提高语音识别鲁棒性的重要问题和途径,文中还提出了标注性学习、提示性猜测的逐步过渡的训练和自适应方法,用于汉语大词汇连续语音识别。  相似文献   

2.
梁钊 《电声技术》2004,(12):47-50,53
分布式语音识别(DSR)是近年来出现的新技术,具有广阔的应用前景。结合ETSI关于DSR的最新标准介绍了DSR系统的组成,分析了DSR的主要技术,如前端特征提取算法、特征压缩与纠检错、服务器端的语音重构算法等,最后对DSR技术的应用做了简单展望。  相似文献   

3.
不良语音识别技术是在高清音视频业务中监测不良信息的有效手段。本文提出了一个基于声学模型的不良语音识别框架。并针对框架中特征提取、声学模型构建、不良语音判定模型三个重要部分的实现方法进行分析描述。并列举了各种方法的优缺点。对构建高效的不良语音识别系统具有较高的参考价值。  相似文献   

4.
有关语音识别技术的研究   总被引:2,自引:0,他引:2  
李宏梅  伍小芹 《现代电子技术》2010,33(8):138-140,144
语音识别是将音频数据转换成文本或者其他形式的计算机可以处理的信息。这里简单介绍语音识别技术的发展历史和现状,阐述了典型语音识别系统的基本原理,对语音识别的基本方法和识别过程进行深入分析,探讨语音识别技术发展过程中的难点问题,给出了相应对策。  相似文献   

5.
分布式语音识别的前端处理及相关标准   总被引:1,自引:1,他引:0  
语音识别在实际应用中受到信道噪声和便携终端计算、存储能力不足等因素制约。分布式语音识别(DSR)不仅解决了上述的问题,还有占用带宽窄、综合成本低等优点,但其应用的前提是提取的参数必须标准化。文中介绍了分布式语音识别前端处理的基本结构以及相关标准。  相似文献   

6.
本文提出将语音情感识别技术运用于呼叫中心的日常工作,以解决录音质检、投诉校准、客户情绪第一时间识别、客服代表服务热情实时提醒等问题。  相似文献   

7.
《电视技术》2012,(Z1):60
自动语音识别技术(Auto Speech Recognize,ASR)所要解决的问题是让计算机能够"听懂"人类的语音,将语音中包含的文字信息"提取"出来。ASR技术在"能听会说"的智能计算机系统中扮演着重要角色,相当于给计算机系统安装上"耳朵",使其具备"能听"的功能,进而实现信息时代利用"语音"这一最自然、最便捷的手段进行人机通信和交互。  相似文献   

8.
唐艺明 《电子质量》2013,(10):43-46
语音识别(speech Recognition)是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的技术。该文通过采用互相关卷积算法,实现对韵母(a,o,e,i,u,ǖ)的识别进行了初步的研究和探讨,实现了在MATLAB环境下对韵母(a,o,e,i,u,ǖ)的语音识别,并针对语音识别系统的频谱与互相关卷积的主要特点做出了总结与分析。  相似文献   

9.
语音识别作为信息技术中一种人机接口的关键技术,具有重要的研究意义和广泛的应用价值。介绍了语音识别技术发展的历程,具体阐述了语音识别概念、基本原理、声学建模方法等基本知识,并对语音识别技术在各领域的应用作了简要介绍。  相似文献   

10.
李洪伟  马琳  李海峰 《信号处理》2023,39(4):639-648
语音是人类表达思想和感情交流最重要的工具,是人类文化的重要组成部分。语音情感识别作为情感计算中的重要课题已经成为国际上的研究热点,受到越来越多的关注。已有神经科学研究表明,大脑是产生调节情感的物质基础。因此,在语音情感的研究中,我们不能仅考虑语音信号自身,还应将大脑的活动信号融入语音情感识别中,以实现更高准确率的情感识别。基于上述思想,本文提出了一种基于核典型相关分析(KCCA)的语音特征提取方法。该方法将语音特征与脑电图(EEG)特征映射到高维希尔伯特空间,并计算二者的最大相关系数。KCCA将语音特征在高维希尔伯特空间上向与脑电特征相关性最大的方向投影,最终得到包含脑电信息的语音特征。本文方法将与语音情感相关的脑电信息融入语音情感特征提取中,所提特征能够更准确的表征情感。同时,本方法在理论上具有良好的可迁移性,当所提脑电特征足够准确与具有代表性时,KCCA建模得到的投影向量具有通用性,可直接用于新的语音情感数据集中而无需重新采集和计算相应的脑电信号。在自建语音情感数据库与公开语音情感数据库MSP-IMPROV上的实验结果表明,使用投影语音特征进行语音情感分类的方法优于使用原始音频特征...  相似文献   

11.
讨论了欧洲电信标准委员会ETSI提出的分布式语音识别系统的抗噪前端特征提取算法,该算法融合多种抗噪技术。结合汉语语音的特点,进行了汉语语音识别整体框架下的算法实现,并进行了实验和分析,典型噪声环境下的识别结果证明,相对于基线MFCC特征提取算法,稳健性有较大提高。  相似文献   

12.
蒋文建  韦岗 《电子学报》2001,29(Z1):1829-1832
本文根据多时间尺度分析与子带方法,提出了一种多时间尺度复合子带的噪声环境下语音识别新方法.新方法在不同的时间尺度下分别进行子带特征提取和全带特征提取,并分别进行识别,然后在识别概率层相结合得到最终识别结果.本方法兼有多时间尺度方法和子带方法的抗噪性能.此外,进一步引入频谱差分方法提高语音特征的抗噪性能.对E-SET在NoiseX92下白噪声的识别实验表明,新方法具有良好的抗噪性能.  相似文献   

13.
训练环境和测试环境的不匹配是造成实际情况下语音识别性能下降的主要原因。在深入研究语音识别的噪声环境和Mel域倒谱系数(MFCC)流程的基础上,基于累计分布函数匹配思想,给出了3种通过减小训练环境和测试环境的不匹配度来提高系统在不同环境下适应性的鲁棒性特征提取方法,分析了它们的理论基础、基本算法,并在Aurora2.0数据库上进行了实现,验证了方法的有效性,为实际应用中如何选择语音识别系统提供了参考。  相似文献   

14.
欧智坚  王作英 《电子学报》2003,31(4):608-611
尽管作为当前最为流行的语音识别模型, HMM由于采用状态输出独立同分布假设,忽略了对语音轨迹动态特性的描述.本文基于一个更为灵活的语音描述统计框架—广义DDBHMM,提出了一个具体的多项式拟合语音轨迹模型,以及新的训练和识别算法,更好地刻划了真实的语音特性.本文还给出了一种有效的剪枝算法,得到一个实用化模型.汉语大词汇量非特定人连续语音识别的实验表明,这种剪枝的多项式拟合语音轨迹模型以较少的计算量明显改善了识别系统的性能.  相似文献   

15.
针对模式识别中的彩色人脸识别问题,论文提出了一种多核学习特征选择方法,利用多核学习特征选择算法对不同色彩通道的人脸特征进行特征选择,再结合典型相关性分析算法对选择得到的多色彩通道特征进行融合,从而提取出有效的人脸描述特征。实验结果表明,该方法可以有效地提高人脸识别率。  相似文献   

16.
李伟  李媛媛 《电声技术》2011,35(7):42-44
针对目前汉语连续语音识别中英文识别问题,采用中英文混合建模的方法建立中英文混合模型.在分析已有语音识别系统的基础上,根据发音学的一些先验知识,提出一种基于主元音及英文音素序列混合的声学模型,同时利用最大似然规则训练出的声学模型,通过最小音素错误准则对声学模型进行区分性训练,更新得到最终的声学模型.在测试集上的结果表明,...  相似文献   

17.
结合基于无人水下航行器(UUV)小型拖线阵的应用,针对常规扩展拖曳阵测量方法(ETAM)在阵列存在运动误差时算法性能有所下降,提出一种运动误差估计与相位校正法.在阵形保持直线阵的前提下,采用最小二乘算法对相邻两次测量中位置重叠阵元相位相关因子进行线性拟合,根据拟合出的关系式对阵列输出数据进行相位补偿,从而有效克服线列阵的偏航带来的相位误差.在阵列偏航3°和5°时,仿真结果表明新算法的方位分辨性能有所提高.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号