共查询到20条相似文献,搜索用时 93 毫秒
1.
由于智能仪器仅将语音功能作为其子功能之一,因此要求智能仪器中的语音处理部分设计合理.本文利用计算机多媒体技术完成语音记录部分,仅将语音回放部分嵌入到智能仪器中,使智能仪器设计灵活、成本低廉. 相似文献
2.
介绍了语音信号处理的关键技术,论述了在语音识别与合成和多媒体数据库中基于内容的语音数据检索的应用特点,指出了建立分层次的语音特征表示将有利于语音特征提取和满足不同层次的应用需要。 相似文献
3.
混沌自同步序列发生器和数字语音保密通信 总被引:3,自引:0,他引:3
提出一种基于自同步序列密码的混沌加密系统,并将产生的混沌序列用于数字语音保密通信,对该混沌序列进行了随机性测试,同时利用计算机网络实现了一个数字语音保密通信试验系统,并取得满意的效果。 相似文献
4.
语音识别技术一直是学术界研究的热点。语音特征信息综合是提高语音识别系统性能的一条有效途径。提出了一种语音特征信息综合快速算法——N-BEST算法。该方法可以较大地减少语音特征信息综合的运算量,提高特征信息综合语音识别系统的运行速度。 相似文献
5.
针对抗噪声语音特征技术和基于MFCC特征的模型补偿技术在低信噪比时识别率不高的缺点,将抗噪声语音特征和模型补偿结合起来,提出了一种基于单边自相关序列(One—sided autocorrelation,OSA)MFCC特征的模型补偿噪声语音识别方法,以提高语音识别系统在低信噪比时的性能。对0~9十个英文数字和NOISEX92中的白噪声、F16噪声和FACTORY噪声的识别实验结果表明.本文提出的识别方法可以有效地提高OSA—MFCC识别器在噪声环境中的识别率,并且在低信噪比时其性能明显优于经过相同补偿处理的MFCC识别器。 相似文献
6.
AI克隆语音技术的出现将对现代社会法治秩序造成致命冲击。近年来研究人员仅关注了AI合成语音与样本语音内容相同领域的研究,而对AI合成语音与样本内容不同的检材的鉴定研究却甚少,相关鉴定内容无法识别。为此,提出了一种三维度基于改进MFCC特征模型对AI克隆语音源进行鉴定。首先对先前研究人员人工分析的AI克隆语音特性进行验证,总结出可识别的“共振峰F5异常活跃”与“能量、共振峰、音高曲线异常突变”的特征。其次基于AI克隆语音的特征运用二阶差分修正MFCC系数并采用“逆差逻辑推演法”将能量、共振峰、音高曲线突变特性进一步量化采样,将其定义为语音鉴定的特征向量三元组。然后以特征向量三元组为输入,运用D-S证据合成规则将三组检材与样本比对的结果融合。最后形成三维度基于改进MFCC特征参量的检材评定模型。人群随机采样实验结果表明,该AI克隆语音源鉴定方法对以同一人为克隆源所合成的AI克隆语音鉴定的平均概率为67.324%,标准差为7.32%,鉴定效果很好。 相似文献
7.
研究多噪声背景下基于声音的身份准确识别问题。当个体声音混淆在其它声音背景下的时候,个体独特的语音特征由于混有噪声特征,导致自身特征发生退化。造成的传统语音特征进行识别的方法,由于无法克服"噪声"干扰下语音特征的退化,造成识别准确性不高。提出了根据语音特征概率决策的混合语音识别方法。采用对混合语音进行独立的有效特征检测,根据特征概率决策算法将语音特征进行归属概率识别,并通过特征归属度计算完成身份识别,克服由于语音特征混合,造成语音特征退化造成的识别不准问题。实验结果表明,提出的方法能够对混合的语音特征进行有效的识别,提高了识别的准确度。 相似文献
8.
语音识别技术一直是学术界研究的热点。语音特征信息综合是提高语音识别系统性能的一条有效途径。提出了一种语音特征信息综合快速算法———N BEST算法。该方法可以较大地减少语音特征信息综合的运算量,提高特征信息综合语音识别系统的运行速度 相似文献
9.
通过窄带信道将语音信号传输到远端的识别系统,从而实现远距离的人机对话,具有重要的现实意义。在2.4kbps的速率下,语音编码算法依然可以合成出可懂度非常高的语音,但是这样的语音信号与原始语音相比还是有巨大的损失。低速率语音编码算法对于语音识别产生的影响是巨大的,因此必须想办法减轻这种损失对于识别的损害。在此选择了三种不同的低速率语音编码器,分别使用LPC(Linear Pledictive Coding,线性预测)算法、MELP(Mixed Excitation Linear Prediction,混合激励线性预测)算法和IMBE(Improved Multiband Excitation,增强多带激励)算法,都在2.4kbps的速率下工作,将其对语音识别系统的影响进行了比较。对于特定人连续语音识别系统和非特定人连接词识别系统,在使用不同的特征矢量时,不同编码器产生的识别效果有比较大的差异。实验结果表明,语音编码器和语音识别系统的结构有很重要的联系,尽量采用相近的结构有助于获得良好的识别结果。另外,改变提取语音识别特征参数的方式也会有利于提高语音识别系统的性能。 相似文献
10.
11.
提出了一种基于双层码本的语音驱动视觉语音合成系统,该系统以矢量量化的思想为基础,建立语音特征空间到视觉语音特征空间的粗耦合映射关系。为加强语音和视觉语音的关联性,系统分别根据语音特征与视觉语音特征的相似性两次对样本数据进行自动聚类,构造同时反映语音之间与视觉语音之间相似性的双层映射码本。数据预处理阶段,提出一种能反映视觉语音几何形状特征与牙齿可见度的联合特征模型,并在语音特征LPCC及MFCC基础上采用遗传算法提取视觉语音相关的语音特征模型。合成的视频中图像数据与原始视频中图像数据的比较结果表明,合成结果能在一定程度上逼近原始数据,取得了很好的效果。 相似文献
12.
对于非实验室条件下的实时语音识别系统来说,能否准确提取出所需要的语音信号特征,是决定该识别系统正识率高低的关键因素之一,对语音信号进行预滤波以抑制噪音,有利于语音信号特征的提取,本文结合一个实际系统,讨论了其降噪问题,并建议以倒谱参数方差之统计特性是否符合一定规律的为标准,来衡量预滤波的效果,文中还对数字滤波器及随机低门限时域中心削波在预滤波中的作用进行了讨论,实验结果表明,预滤波取得了较好的效果 相似文献
13.
文章提出了一种抗噪声的语音特征。首先让语音信号的功率谱通过一组带通滤波器,再计算各滤波器输出的差分值。理论分析和实验一致证明,以此作为语音信号的特征,可以大幅度提高语音识别系统在噪声环境中的性能。 相似文献
14.
文中考虑语音的音频和视频双模型特性,建立了一个在噪音环境下的基于音频和视频复合特征的连续语音识别系统。在视频特征提取方面,引入了一种鲁棒性较好的数据筛特征提取方法:在音频和视频集成建模方面,使用多数据流HMM来反映语音的双模型特性。识别实验表明,文中建立的音频视频连续语音识别系统具有很好的抗噪性。 相似文献
15.
语音/音乐自动分类中的特征分析 总被引:16,自引:0,他引:16
综合分析了语音和音乐的区别性特征,包括音调,亮度,谐度等感觉特征与MFCC(Mel-Frequency Cepstral Coefficients)系数等,提出一种left-right DHMM(Discrete Hidden Markov Model)的分类器,以极大似然作为判别规则,用于语音,音乐以及它们的混合声音的分类,并且考察了上述特征集合在该分类器中的分类性能,实验结果表明,文中提出的音频特征有效,合理,分类性能较好。 相似文献
16.
为有效利用语音情感词局部特征,提出了一种融合情感词局部特征与语音语句全局特征的语音情感识别方法。该方法依赖于语音情感词典的声学特征库,提取出语音语句中是否包含情感词及情感词密度等局部特征,并与全局声学特征进行融合,再通过机器学习算法建模和识别语音情感。对比实验结果表明,融合语音情感词局部特征与全局特征的语音情感识别方法能取得更好的效果,局部特征的引入能有效提高语音情感识别准确率。 相似文献
17.
18.
讨论了一些语音改变技术的应用场合,分析了语音改变的一般方法,并提出了一种新的针对PLAR(pseudo log arearatio)曲线进行变换的语音改变方法,从而使说话人的语音特征得到改变。该方法采用了基于音段和听觉的方法来改变语谱特征参数,算法简便,计算量少,便于实时处理。用该算法实现了语音通信中个人隐私的实时保护。 相似文献
19.