期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

语音识别的发展现状 总被引：5，自引：0，他引：5

俞铁城《通讯世界》2005,(2):56

语音识别基础让机器听懂人类的语音,这是人们长期以来梦寐以求的事情。语音识别是一门交叉学科,关系到多学科的研究领域,不同领域上的研究成果都对语音识别的发展作了贡献。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。计算机语音识别过程与人对语音识别处理过程基本上是一致的。目前主流的语音识别技术是基于统计模式识别的基本理论。一个完整的语音识别系统可大致分为三部分:(1)语音特征提取:目的是从语音波形中提取随时间变化的语音特征序列。(2)声学模型与模式匹配(识别算法):声学模型是识别系… 相似文献

2.

语音情感识别综述

下载免费PDF全文

陶建华陈俊杰李永伟《信号处理》2023,39(4):571-587

语音情感识别是利用计算机建立语音信息载体与情感度量之间的关系,并赋予计算机识别、理解人类情感的能力,语音情感识别在人机交互中起着重要作用,是人工智能领域重要发展方向。本文从语音情感识别在国内外发展历史以及开展的一系列会议、期刊和竞赛入手,分别从6个方面对语音情感识别的研究现状进行了梳理与归纳：首先,针对情感表达从离散、维度模型进行了阐述;其次,针对现有的情感数据库进行了统计与总结;然后,回顾了近20年部分代表性语音情感识别发展历程,并分别阐述了基于人工设计的语音情感特征的情感识别技术和基于端到端的语音情感识别技术;在此基础之上,总结了近几年的语音情感识别性能,尤其是近两年在语音领域的重要会议和期刊上的语音情感识别相关工作;介绍了语音情感识别在驾驶、智能交互领域、医疗健康,安全等领域的应用;最后,总结与阐述了语音情感识别领域仍面临的挑战与未来发展方向。本文旨在对语音情感识别相关工作进行深入分析与总结,为语音情感识别相关研究者提供有价值的参考。相似文献

3.

有关语音识别技术的研究 总被引：2，自引：0，他引：2

李宏梅伍小芹《现代电子技术》2010,33(8):138-140,144

语音识别是将音频数据转换成文本或者其他形式的计算机可以处理的信息。这里简单介绍语音识别技术的发展历史和现状,阐述了典型语音识别系统的基本原理,对语音识别的基本方法和识别过程进行深入分析,探讨语音识别技术发展过程中的难点问题,给出了相应对策。相似文献

4.

语音识别的非线性方法 总被引：5，自引：0，他引：5

董远胡光锐《电路与系统学报》1998,3(1):52-58

语音信号是一个复杂的非线性过程，这使得基于线性系统理论发展起来的传统语音识别技术性能难以进一步提高。近年来人们开始逐渐重视非线性在语音识别技术中的应用，本文概括地介绍了非线性理论在语音识别技术中的所取得的成果和发展方向，除了涉及较为流行的隐马尔柯夫过程和人工神经网络在语音识别中的应用外，文中着重论述了近年来发展迅猛的混沌，分形理论在语音识别中的应用，本文最后还提到不可忽视的分形理论在语音编码中的应相似文献

5.

鲁棒性语音识别技术研究综述

《信息通信》2019,(11)

鲁棒性语音识别是为了解决噪声环境和混响环境等外界因素所引起的语音识别系统训练和识别不匹配的情况,针对在噪声和混响条件下进行鲁棒性语音识别的问题,对现有的鲁棒性语音识别研究进行了总结,阐述了语音识别的主要流程和整体框架;从特征提取和声学建模两个方面对语音增强技术、语音分离技术进行介绍;分析鲁棒性语音识别技术主要难点和实现过程。最后对鲁棒性语音识别技术进行总结和展望。相似文献

6.

语音识别与理解的研究进展 总被引：1，自引：0，他引：1

江铭虎袁保宗《电路与系统学报》1999,4(2):53-59

本文综述了当前语音识别理解的发展趋势和最新进展。指出美国在不依说话人的大词汇表的连续语音隐马尔柯夫模型识别方面起主导地位,日本在大词汇表的连续语音神经网络识别、模拟人工智能进行语音后处理方面起主导地位,并介绍了国际上最优秀的语音识别理解系统。相似文献

7.

用反馈式语音识别理解方案进行汉语短语的识别理解

傅秋良袁保宗《电子与信息学报》1998,20(2):194-198

汉语语音理解系统的任务之一是把语音识别系统获得的汉语单音节转换成正确的汉字、词,乃至汉语的短语、语句,与语音识别系统一起,完成一个语音到文本(speech to text)的转换系统。本文利用一个闭环反馈方式汉语语音识别理解方案,在汉语词识别理解的基础上,进一步实现对汉语结构性短语的识别理解,获得了预期的结果。最后本文对实验结果和反馈式语音识别理解方案进行了讨论。相似文献

8.

针对自发性语音的识别方案

叶远国《电子测试》2015,(4):36-38

为了提高自发性口语语音识别率及语音解码识别效率,提出了一种新的自发性语音识别方案。实验结果表明,该识别方案不仅能提高语音识别率,而且还能有效准确地切分音频,提高评测系统的解码效率,鲁棒性较强。相似文献

9.

基于机器学习的语音情感识别技术研究

邬卓恒时小芳《信息技术与信息化》2022,(1):213-216

针对快速发展的语音情感识别技术,归纳总结了机器学习算法在语音情感识别领域的发展过程并预测语音情感识别技术的发展方向.首先针对语音情感的离散描述模型,总结语音情感识别模型训练和识别算法的一般过程;然后,根据机器学习算法的发展阶段,分别对比分析传统机器学习算法,深度神经网络、卷积神经网络、循环神经网络等深度学习算法与语音情... 相似文献

10.

浅说语音识别技术

袁冰清于淦周霞《数字通信世界》2020,(2):43-44,18

语音识别技术已经成为信息技术中人机交互的关键技术,目前已经进入家电、汽车电子、消费电子产品等各个领域。本文简单介绍了语音识别技术的基本原理以及目前应用最广泛的两种端到端语音识别架构。相似文献

11.

Continuous Mandarin speech recognition for Chinese language withlarge vocabulary based on segmental probability model

Shen J.-L. 《Vision, Image and Signal Processing, IEE Proceedings -》1998,145(5):309-315

The author presents a study of large-vocabulary continuous Mandarin speech recognition based on a segmental probability model (SPM) approach. The SPM was found to be very suitable for recognition of isolated Mandarin syllables especially considering the monosyllabic structure of the Chinese language. To extend the application of the model to continuous Mandarin speech recognition, a concatenated syllable matching (CSM) algorithm in place of the conventional Viterbi search algorithm is first introduced. Also, to utilise the available training material efficiently, a training procedure is proposed to re-estimate the SPM parameters using the maximum a posteriori (MAP) algorithm. A few special techniques integrating acoustic and linguistic knowledge are developed further to improve the performance step by step. Preliminary experimental results show that the final achievable rate is as high as 91.62%, which indicates a 18.48% error rate reduction and more than three times faster than the well studied subsyllable-based CHMM 相似文献

12.

汉语连续语音识别中的分级聚类算法的研究和应用

徐向华朱杰郭强《信号处理》2004,20(5):497-500

针对汉语语音单音节结构的特点,考虑音节间协同发音的现象,本文提出了一种对三音子模型进行分级聚类的方法。与传统的基于决策树的状态聚类算法相比,该方法通过对稀少三音子模型聚类,更充分地利用训练数据,减少稀少三音子对状态聚类的影响,从而提高声学模型的鲁棒性。实验结果表明:大词汇量连续语音识别器采用这种分级聚类方法,不仅可以大大减少模型及其参数的数量,还可使系统识别率有所提高,其中误识率相对于传统的决策树状态聚类系统降低了4.93％。相似文献

13.

基于主动标记支持向量机和太赫兹光谱的转基因物质检测方法研究

潘学文刘元明《光电子．激光》2018,29(10):1092-1100

为克服传统支持向量机需要事先对训练样本进行人为标记的缺点,提出了一种主动训练支持向量机模型。利用仿射传播聚类算法对未标记样本进行聚类分析,在迭代过程中不断更新现有支持向量机的训练数据,从而不仅可以减少人为标记样本所带来的误差,还能够最大限度地提高模型的识别准确率。本文以转基因棉花的太赫兹光谱数据为研究对象对该模型进行了验证,实验结果表明,本文提出的方法对总待测样品的种类的识别率为95.56%,较其他三种方法有较少的误判和更高的识别率。基于仿射传播聚类的支持向量机较传统支持向量机有更高的识别率和更低的误判率,为转基因物质的检测提供了一种快速,无损的新方法。相似文献

14.

连续语音识别前端鲁棒性研究

胡丹曾庆宁龙超黄桂敏《电视技术》2015,39(24):43-46

针对大词汇量连续语音识别中识别率不高的问题,提出了将语音增强级联在识别系统前端,在语音增强中将谱减法和对数最小均方误差算法（logmmse）与用于噪声估计的最小控制递归平均算法（imcra）相结合。识别系统使用Mel频率倒谱系数（MFCC）提取特征,用隐马尔科夫模型（HMM）训练与识别。实验结果表明,提出的方法最高能使单词识别率提高38.9%,使句子正确率提高21.8%。该方法用于大词汇量连续语音识别是可行的,有效的。相似文献

15.

基于HMM的连续小词量语音识别系统的研究

高建《现代电子技术》2011,34(11):205-207

为了提高语音识别效率及对环境的依赖性,文章对语音识别算法部分和硬件部分做了分析与改进,采用ARMS3C2410微处理器作为主控制模块,采用UDA1314TS音频处理芯片作为语音识别模块,利用HMM声学模型及Viterbi算法进行模式训练和识别,设计了一种连续的、小词量的语音识别系统。实验证明,该语音识别系统具有较高的识别率和一定程度的鲁棒性,实验室识别率和室外识别率分别达到95.6%,92.3%。相似文献

16.

基于电话语料的维吾尔连续音素识别

米日古力·阿布都热素艾克白尔·帕塔尔艾斯卡尔·艾木都拉《通信技术》2012,45(7):54-56

结合维吾尔语的语音特征和语义信息,在大量电话语音语料库的基础上,以建立维吾尔语连续音素识别平台为目标,通过构建隐马尔科夫模型工具HTK(Hidden Markov Model Toolkit)工具实现了维吾尔语连续音素识别算法:首先根据具体技术指标完成了较大规模电话语音语料库的录制和标注工作;确定音素为基元,通过训练获得了每个音素的HMM(Hidden Markov Model)声学模型,随后对输入的语音进行识别,声学模型在不同的高斯混合数目下,得出了识别结果;统计了32个音素的识别率并对它进行分析,为了进一步提高识别率奠定了基础。相似文献

17.

改进的高效动态时间规整算法语音识别系统

王新胜巩捷甫喻明艳《太赫兹科学与电子信息学报》2015,13(6):942-946

动态时间规整算法是结合了动态时间规整(DTW)技术和距离测度计算技术的一种非线性规整算法,在语音识别模板匹配中有重要的应用。为此提出一种改进的高效动态时间规整算法,其能有效加快搜索路径的寻找。基于Matlab实现了隐马尔科夫算法、高效动态时间规整算法和改进的高效动态时间规整算法的语音识别系统,同时进行了算法的仿真实验。实验结果表明,基于改进高效动态时间规整算法的训练速度远大于基于隐马尔可夫算法和高效动态时间规整算法的训练速度,而识别率下降很小,对于小词汇量非连续语音识别中高效动态时间规整算法的识别率为97.56%,隐马尔可夫算法的识别率为97.14%,改进高效动态时间规整算法的识别率为96.43%。相似文献

18.

动态时间规正与差别子空间相结合变异语音识别的在线训练方法

吕成国韩纪庆王承发高文《信号处理》2005,21(1):102-105

应力影响下的变异语音(由于说话人受到重力加速度变化而产生)可以用动态时间规正与差别子空间相结合的方法进行识别,但是该方法空间开销很大,而且训练算法极为复杂。针对该方法提出特征矢量替换法和特征矢量求平均法两种基于聚类思想的简单在线训练方法,取一个较小的初始训练集,然后用在线训练的方法使系统识别率达到最大。实验结果表明,其中特征矢量求平均的在线训练方法非常有效,保证系统整体识别率的同时,大大减小了系统的空间开销,适合于训练数据有限的变异语音识别。相似文献

19.

基于MFCC参数的说话人特征提取算法的改进 总被引：3，自引：0，他引：3

张晶范明冯文全董金明《电声技术》2009,33(9):61-64,69

在说话人识别系统中,特征参数的提取对语音训练和识别有着重要的影响。对于特征参数提取模块,提出了一种新的特征参数提取算法MFCC_E（Efficient MFCC）。相对于标准算法MFCC_S（StandardMFCC）,MFCC_E在特征提取模块部分减少了53％的计算量。最终实验结果说明MFCC_E的识别率为90.3％,仅比标准MFCC算法92．0％的识别率降低1．7％。因为MFCC_E算法的这种特点,使其能够更有效的适用于硬件实现。相似文献

20.

基于CHMM的语音识别仿真系统实现

李浩亮靳双燕贾伟伟《电声技术》2013,(12):75-78

介绍了一种基于连续M元高斯混合密度的隐马尔可夫模型（HMM）的非特定人孤立词语音识别仿真系统。通过研究模型状态数、训练时间以及特征参数选取对语音识别率的影响,得出HMM状态数取4,训练次数为20次,特征参数选取48维LPCC和MFCC的混合参数,可使语音识别系统对于汉语孤立词的识别率达到90％。相似文献