共查询到20条相似文献,搜索用时 46 毫秒
1.
随着Internet技术的广泛使用,出现了通过Internet来传输语音的新的通信方式——VOIP技术;由此产生了网络环境下语音识别的新问题,这是一个富有挑战性的研究课题。本文将讨论这种网络环境下语音识别的方法和技术。 相似文献
2.
本文利用声音信号的短时平均幅差函数(AMDF),介绍了一种识别语音命令的简单方法,通过一定的软件编程控制,能有效地识别4~5个不同的语音命令,且程序运行快捷,能满足实时操作的需要。 相似文献
3.
4.
为有效利用语音情感词局部特征,提出了一种融合情感词局部特征与语音语句全局特征的语音情感识别方法。该方法依赖于语音情感词典的声学特征库,提取出语音语句中是否包含情感词及情感词密度等局部特征,并与全局声学特征进行融合,再通过机器学习算法建模和识别语音情感。对比实验结果表明,融合语音情感词局部特征与全局特征的语音情感识别方法能取得更好的效果,局部特征的引入能有效提高语音情感识别准确率。 相似文献
5.
变异情况对语音的影响是导致语音识别系统性能下降的原因之一。一般情况下变异语音数据采集困难,获得的训练数据量少,这样即使测试环境和训练环境都相同,识别性能也不理想。利用自适应算法可以解决这类问题,它采用少量的测试环境数据进行训练,以达到训练模型和测试数据匹配的目的,保证系统良好的识别性能。MAP算法是常用的自适应算法,大多应用于话者自适应环境,该文尝试将其应用于变异语音识别系统中,并通过对该模型做相应改进获得了较好的识别结果。在小词表特定人应力变异的识别实验中,分别用非特定人模型和改进的特定人模型作为初始模型,应用MAP算法,系统识别率均有明显提高,与基本识别系统相比,在10遍自适应数据前提下,识别率分别提高了15.84%和15.97%,最好的识别率达到85.56%和90.42%。 相似文献
6.
提出了一种将人耳听觉响度特性应用于噪声下语音识别的前端特征提取方法.本文使用分层遗传算法设计响度加权滤波器,对频谱进行听觉特性加权.将本方法应用于TIMIT数据包的E-SET在Noise X92的各种噪声条件下的识别实验.实验结果表明,在各种噪声的不同信噪比下,对LPCC和MFCC特征,采用响度加权平均识别率分别有7%和¨%的提高,证明本方法是有效的. 相似文献
7.
在人机语音交互系统中,机器不仅要具有理解人类语音的能力,还应当具有识别说话人情感的能力.本文提出了基于高斯混合模型(GMM)的序列分类和识别的改进方法,并将该方法引入到语音情感识别的研究中.本文提出了观测值次序均衡的方法.实验结果证明这种新的方法有效地提高了语音情感识别的准确率. 相似文献
8.
提出一种噪声下的多数据流子带语音识别方法。传统的子带特征方法虽然能提高噪声下的语音识别性能,但通常会使无噪声情况下的识别性能下降。新方法提取感知线性预测(PLP)特征和子带特征,分别进行识别,然后在识别概率层将两者相结合。通过E-Set在NoiseX92下的白噪声的识别实验表明,新方法不仅具有更好的抗噪性能,而且同时能提高无噪声情况下的识别性能。 相似文献
9.
10.
语音情感识别在金融反欺诈等领域有着重要的应用前景,但是语音情感识别的准确率提升变得越来越困难.现有基于语谱图的语音情感识别等方法难以捕捉节奏差异特征,从而影响识别效果.文中基于语音节奏特征的差异性,提出了能量帧时频融合的语音情感识别方法.其关键是,针对语音中高能量区域进行频谱筛选,以高能语音帧的分布和时频变化来体现个体的语音节奏差异.在此基础上建立基于卷积神经网络(CNN)和循环神经网络(RNN)的情感识别模型,实现对频谱的时域和频域变化特征的提取与融合.在公开数据集IEMOCAP上进行实验,结果表明,该基于语音节奏差异的语音情感识别与基于语谱图的方法相比,在加权准确率WA和非加权准确率UA指标上分别平均提升了 1.05%和1.9%;同时也表明个体的语音节奏差异对提升语音情感识别效果具有重要作用. 相似文献
11.
随着手持设备的日益小型化以及一些特殊场合的限制,使用语音识别这种自然的人机接口技术愈发显得迫切。基于HMM架构的语音识别技术经过几十年的发展,在实验室环境下已经取得了很高的识别率。当前已经取得的技术要想走向实用化,所面临的最大障碍来自于语音识别前端的鲁棒性问题。本文对语音识别的前端鲁棒性问题做了比较深入细致的分析,并在此基础上比较全面地介绍了解决这些棘手问题所采取的一些措施。文章最后对语音识别前端鲁棒性问题给出了一定的讨论和展望。 相似文献
12.
抗噪声语音识别及语音增强算法的应用 总被引:1,自引:0,他引:1
提高语音识别系统的鲁棒性是语音识别技术一个重要的研究课题。语音识别系统往往由于训练环境下的数据和识别环境下的数据不匹配造成系统的识别性能下降,为了让语音识别系统在含噪的环境下获得令人满意的工作性能,该文根据人耳听觉特性提出了一种鲁棒语音特征提取方法。在MFCC特征提取之前先对含噪语音特征进行掩蔽特性处理,同时结合语音增强方法对特征进行处理,最后得到鲁棒语音特征。通过4种不同试验结果分析表明,将这种方法用于抗噪声分析可以提高系统的抗噪声能力;同时这种特征的处理方法对不同噪声在不同信噪比有很好的适应性。 相似文献
13.
本文介绍了一个拥有2000个说话者的面向移动电话应用的粤语语音数据库,该语音库用于电话应用方面的语音识别研究。在简单介绍本语音数据库的开发背景后,着重介绍了该语音库的结构、内容、特点和注释规范。 相似文献
14.
中等词汇的汉英语音翻译系统 总被引:1,自引:0,他引:1
本文给出汉英语音翻译系统的组成,介绍了系统中连续汉语语音识别和汉英机器翻译的工作;我们已经在限定主题、中等词汇量的条件下实现了非特定人的连续语音识别,实现了汉英语音翻译实验演示系统。 相似文献
15.
16.
基于COM技术的语音应用系统的设计和实现 总被引:3,自引:0,他引:3
描述了将COM技术引用到语音应用系统的设计和实现中,提出利用COM技术定制语音应用系统的想法,并以Microsoft的SpeechSDK5.0为例,给出开发语音应用系统的主要设计思想、系统结构和实现方法。 相似文献
17.
提出了一种抗噪声语音特征。首先计算语音信号单边自相关序列的差分序列,再计算该差分序列的线性预测系数,进一步求出例说系数。实验证明,传统的线性预测例谱系数和边自相关序列的一性预测倒谱数相比,采用单边自相关序列差分序列的线性预测倒谱系数作为语音信号的特征矢量,可以提高语音识别系统对带噪音语音的识别率。 相似文献
18.
一种精确检测语音端点的方法 总被引:1,自引:0,他引:1
端点检测是语音识别中的一项关键技术,端点检测的准确性对语音识别的性能有很大影响,特别是对端点检测比较敏感的语音识别算法。本文引用窗长动态变化的端点检测技术,并将传统的双门限端点检测算法和窗长动态改变的端点检测技术结合起来用于语音端点检测。大量实验表明这种技术可以比较精确的检测语音端点,特别是地检测语音的起始端点中有很大的优势。使用改进后的语音端点检测技术,可以有效地提高语音识别率。 相似文献
19.
20.
语音信号是一种时变、非平稳的随机信号。现有语音识别系统的适应性比较差,尤其在高噪声环境下的语音识别非常困难,若将语音识别系统商品化,还有识别速度、拒识问题以及关键词/句检测技术等细节问题需要解决。如何把语言学、生理学、心理学方面的研究成果量化、建模并用于语音识别,还需深入研究。本文介绍了语音识别中小波分析的研究现状及几种常见的技术方法,并且分析探讨了语音识别中小波分析的应用和发展前景。 相似文献