首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 359 毫秒
1.
语音识别的发展现状   总被引:5,自引:0,他引:5  
语音识别基础让机器听懂人类的语音,这是人们长期以来梦寐以求的事情。语音识别是一门交叉学科,关系到多学科的研究领域,不同领域上的研究成果都对语音识别的发展作了贡献。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。计算机语音识别过程与人对语音识别处理过程基本上是一致的。目前主流的语音识别技术是基于统计模式识别的基本理论。一个完整的语音识别系统可大致分为三部分:(1)语音特征提取:目的是从语音波形中提取随时间变化的语音特征序列。(2)声学模型与模式匹配(识别算法):声学模型是识别系…  相似文献   

2.
语音情感识别是利用计算机建立语音信息载体与情感度量之间的关系,并赋予计算机识别、理解人类情感的能力,语音情感识别在人机交互中起着重要作用,是人工智能领域重要发展方向。本文从语音情感识别在国内外发展历史以及开展的一系列会议、期刊和竞赛入手,分别从6个方面对语音情感识别的研究现状进行了梳理与归纳:首先,针对情感表达从离散、维度模型进行了阐述;其次,针对现有的情感数据库进行了统计与总结;然后,回顾了近20年部分代表性语音情感识别发展历程,并分别阐述了基于人工设计的语音情感特征的情感识别技术和基于端到端的语音情感识别技术;在此基础之上,总结了近几年的语音情感识别性能,尤其是近两年在语音领域的重要会议和期刊上的语音情感识别相关工作;介绍了语音情感识别在驾驶、智能交互领域、医疗健康,安全等领域的应用;最后,总结与阐述了语音情感识别领域仍面临的挑战与未来发展方向。本文旨在对语音情感识别相关工作进行深入分析与总结,为语音情感识别相关研究者提供有价值的参考。  相似文献   

3.
有关语音识别技术的研究   总被引:2,自引:0,他引:2  
李宏梅  伍小芹 《现代电子技术》2010,33(8):138-140,144
语音识别是将音频数据转换成文本或者其他形式的计算机可以处理的信息。这里简单介绍语音识别技术的发展历史和现状,阐述了典型语音识别系统的基本原理,对语音识别的基本方法和识别过程进行深入分析,探讨语音识别技术发展过程中的难点问题,给出了相应对策。  相似文献   

4.
语音识别的非线性方法   总被引:5,自引:0,他引:5  
语音信号是一个复杂的非线性过程,这使得基于线性系统理论发展起来的传统语音识别技术性能难以进一步提高。近年来人们开始逐渐重视非线性在语音识别技术中的应用,本文概括地介绍了非线性理论在语音识别技术中的所取得的成果和发展方向,除了涉及较为流行的隐马尔柯夫过程和人工神经网络在语音识别中的应用外,文中着重论述了近年来发展迅猛的混沌,分形理论在语音识别中的应用,本文最后还提到不可忽视的分形理论在语音编码中的应  相似文献   

5.
鲁棒性语音识别是为了解决噪声环境和混响环境等外界因素所引起的语音识别系统训练和识别不匹配的情况,针对在噪声和混响条件下进行鲁棒性语音识别的问题,对现有的鲁棒性语音识别研究进行了总结,阐述了语音识别的主要流程和整体框架;从特征提取和声学建模两个方面对语音增强技术、语音分离技术进行介绍;分析鲁棒性语音识别技术主要难点和实现过程。最后对鲁棒性语音识别技术进行总结和展望。  相似文献   

6.
语音识别与理解的研究进展   总被引:1,自引:0,他引:1  
本文综述了当前语音识别理解的发展趋势和最新进展。指出美国在不依说话人的大词汇表的连续语音隐马尔柯夫模型识别方面起主导地位,日本在大词汇表的连续语音神经网络识别、模拟人工智能进行语音后处理方面起主导地位,并介绍了国际上最优秀的语音识别理解系统。  相似文献   

7.
为了提高自发性口语语音识别率及语音解码识别效率,提出了一种新的自发性语音识别方案。实验结果表明,该识别方案不仅能提高语音识别率,而且还能有效准确地切分音频,提高评测系统的解码效率,鲁棒性较强。  相似文献   

8.
汉语语音理解系统的任务之一是把语音识别系统获得的汉语单音节转换成正确的汉字、词,乃至汉语的短语、语句,与语音识别系统一起,完成一个语音到文本(speech to text)的转换系统。本文利用一个闭环反馈方式汉语语音识别理解方案,在汉语词识别理解的基础上,进一步实现对汉语结构性短语的识别理解,获得了预期的结果。最后本文对实验结果和反馈式语音识别理解方案进行了讨论。  相似文献   

9.
针对快速发展的语音情感识别技术,归纳总结了机器学习算法在语音情感识别领域的发展过程并预测语音情感识别技术的发展方向.首先针对语音情感的离散描述模型,总结语音情感识别模型训练和识别算法的一般过程;然后,根据机器学习算法的发展阶段,分别对比分析传统机器学习算法,深度神经网络、卷积神经网络、循环神经网络等深度学习算法与语音情...  相似文献   

10.
语音识别技术已经成为信息技术中人机交互的关键技术,目前已经进入家电、汽车电子、消费电子产品等各个领域。本文简单介绍了语音识别技术的基本原理以及目前应用最广泛的两种端到端语音识别架构。  相似文献   

11.
The author presents a study of large-vocabulary continuous Mandarin speech recognition based on a segmental probability model (SPM) approach. The SPM was found to be very suitable for recognition of isolated Mandarin syllables especially considering the monosyllabic structure of the Chinese language. To extend the application of the model to continuous Mandarin speech recognition, a concatenated syllable matching (CSM) algorithm in place of the conventional Viterbi search algorithm is first introduced. Also, to utilise the available training material efficiently, a training procedure is proposed to re-estimate the SPM parameters using the maximum a posteriori (MAP) algorithm. A few special techniques integrating acoustic and linguistic knowledge are developed further to improve the performance step by step. Preliminary experimental results show that the final achievable rate is as high as 91.62%, which indicates a 18.48% error rate reduction and more than three times faster than the well studied subsyllable-based CHMM  相似文献   

12.
徐向华  朱杰  郭强 《信号处理》2004,20(5):497-500
针对汉语语音单音节结构的特点,考虑音节间协同发音的现象,本文提出了一种对三音子模型进行分级聚类的方法。与传统的基于决策树的状态聚类算法相比,该方法通过对稀少三音子模型聚类,更充分地利用训练数据,减少稀少三音子对状态聚类的影响,从而提高声学模型的鲁棒性。实验结果表明:大词汇量连续语音识别器采用这种分级聚类方法,不仅可以大大减少模型及其参数的数量,还可使系统识别率有所提高,其中误识率相对于传统的决策树状态聚类系统降低了4.93%。  相似文献   

13.
潘学文  刘元明 《光电子.激光》2018,29(10):1092-1100
为克服传统支持向量机需要事先对训练样本进行 人为标记的缺点,提出了一种主动训练 支持向量机模型。利用仿射传播聚类算法对未标记样本进行聚类分析,在迭代过程中 不断更新现 有支持向量机的训练数据,从而不仅可以减少人为标记样本所带来的误差,还能够最大限度 地提高模型的识 别准确率。本文以转基因棉花的太赫兹光谱数据为研究对象对该模型进行了验证,实验结果 表明,本文 提出的方法对总待测样品的种类的识别率为95.56%,较其他三种方法 有较少的误判和更高的识别率。 基于仿射传播聚类的支持向量机较传统支持向量机有更高的识别率和更低的误判率,为转基 因物质的检测提供了一种快速,无损的新方法。  相似文献   

14.
胡丹  曾庆宁  龙超  黄桂敏 《电视技术》2015,39(24):43-46
针对大词汇量连续语音识别中识别率不高的问题,提出了将语音增强级联在识别系统前端,在语音增强中将谱减法和对数最小均方误差算法(logmmse)与用于噪声估计的最小控制递归平均算法(imcra)相结合。识别系统使用Mel频率倒谱系数(MFCC)提取特征,用隐马尔科夫模型(HMM)训练与识别。实验结果表明,提出的方法最高能使单词识别率提高38.9%,使句子正确率提高21.8%。该方法用于大词汇量连续语音识别是可行的,有效的。  相似文献   

15.
高建 《现代电子技术》2011,34(11):205-207
为了提高语音识别效率及对环境的依赖性,文章对语音识别算法部分和硬件部分做了分析与改进,采用ARMS3C2410微处理器作为主控制模块,采用UDA1314TS音频处理芯片作为语音识别模块,利用HMM声学模型及Viterbi算法进行模式训练和识别,设计了一种连续的、小词量的语音识别系统。实验证明,该语音识别系统具有较高的识别率和一定程度的鲁棒性,实验室识别率和室外识别率分别达到95.6%,92.3%。  相似文献   

16.
结合维吾尔语的语音特征和语义信息,在大量电话语音语料库的基础上,以建立维吾尔语连续音素识别平台为目标,通过构建隐马尔科夫模型工具HTK(Hidden Markov Model Toolkit)工具实现了维吾尔语连续音素识别算法:首先根据具体技术指标完成了较大规模电话语音语料库的录制和标注工作;确定音素为基元,通过训练获得了每个音素的HMM(Hidden Markov Model)声学模型,随后对输入的语音进行识别,声学模型在不同的高斯混合数目下,得出了识别结果;统计了32个音素的识别率并对它进行分析,为了进一步提高识别率奠定了基础。  相似文献   

17.
动态时间规整算法是结合了动态时间规整(DTW)技术和距离测度计算技术的一种非线性规整算法,在语音识别模板匹配中有重要的应用。为此提出一种改进的高效动态时间规整算法,其能有效加快搜索路径的寻找。基于Matlab实现了隐马尔科夫算法、高效动态时间规整算法和改进的高效动态时间规整算法的语音识别系统,同时进行了算法的仿真实验。实验结果表明,基于改进高效动态时间规整算法的训练速度远大于基于隐马尔可夫算法和高效动态时间规整算法的训练速度,而识别率下降很小,对于小词汇量非连续语音识别中高效动态时间规整算法的识别率为97.56%,隐马尔可夫算法的识别率为97.14%,改进高效动态时间规整算法的识别率为96.43%。  相似文献   

18.
应力影响下的变异语音(由于说话人受到重力加速度变化而产生)可以用动态时间规正与差别子空间相结合的方法进行识别,但是该方法空间开销很大,而且训练算法极为复杂。针对该方法提出特征矢量替换法和特征矢量求平均法两种基于聚类思想的简单在线训练方法,取一个较小的初始训练集,然后用在线训练的方法使系统识别率达到最大。实验结果表明,其中特征矢量求平均的在线训练方法非常有效,保证系统整体识别率的同时,大大减小了系统的空间开销,适合于训练数据有限的变异语音识别。  相似文献   

19.
基于MFCC参数的说话人特征提取算法的改进   总被引:3,自引:0,他引:3  
张晶  范明  冯文全  董金明 《电声技术》2009,33(9):61-64,69
在说话人识别系统中,特征参数的提取对语音训练和识别有着重要的影响。对于特征参数提取模块,提出了一种新的特征参数提取算法MFCC_E(Efficient MFCC)。相对于标准算法MFCC_S(StandardMFCC),MFCC_E在特征提取模块部分减少了53%的计算量。最终实验结果说明MFCC_E的识别率为90.3%,仅比标准MFCC算法92.0%的识别率降低1.7%。因为MFCC_E算法的这种特点,使其能够更有效的适用于硬件实现。  相似文献   

20.
张琳  尹娜  王汝传 《通信学报》2015,36(Z1):53-59
随着无线传感器网络的不断发展,恶意节点对其安全造成了极大的威胁。传统的基于信誉阈值的模型无法准确的识别亚攻击性等恶意节点,而且会出现低识别率和高误判率等问题。为了解决这些问题,引入了基于DPAM-MD算法的新型恶意节点识别方法,在传统信誉阈值判断模型的基础上,通过结合曼哈顿度量和DPAM算法识别出亚攻击性节点。算法中提出一种新型的基于密度的聚类算法,并结合簇间和簇内距离均衡化的目标函数,将所有的节点进行分类。该算法可以提高聚类质量,有效缩短聚类时间,提高了恶意节点识别的效率。经仿真实验结果验证,改进后的算法对识别特征不明显的恶意节点效果十分显著。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号