首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 287 毫秒
1.
根据AMR语音编码算法的特点,研究了AMR语音编码对男声和女声参数特性的差异。在处理分析了大量男声和女声语音数据的基础上,对AMR语音编码中线谱频率(LSF)参数和基音周期参数进行提取和统计,主要研究了这2个参数在样本均值和样本方差方面对男声和女声的差异,并给出了相应的结论和性能优化建议。  相似文献   

2.
汉语普通话语音的分形特性及其盒维数的统计分析   总被引:4,自引:0,他引:4  
本文应用分形理论来研究汉语普通话语音的分形特性。通过计算和统计分析汉语男女声21种声母和38种韵母语音信号时域波形的分形盒维数,得到了汉语语音信号分形维数在维数空间上的分布规律。实验结果表明,汉语语音信号具有分形标度不变性,分形维数能够反映语音信号时域波形的复杂程度。  相似文献   

3.
王华朋  杨军  吴鸣 《电声技术》2013,37(1):57-61,65
为检验似然比证据评估框架下法庭半自动说话人识别系统在有限问题语音条件下的识别性能,提出了一种新的使用元音倒谱和高斯混合模型(GMM)的法庭说话人识别方法。该方法使用多个时期的普通话数据库中元音/a/的倒谱系数进行了验证,与多变量核密度(MVKD)的方法相比,基于GMM的方法在问题语音数据缺乏的情况下具有更好的识别性能。讨论和检验了多个似然比结果的融合方法,并且对识别系统的准确度使用对数似然比代价函数进行了衡量。  相似文献   

4.
罗武骏  黄程韦  査诚  赵力 《信号处理》2013,29(10):1423-1432
本文研究了越南语语音情感识别问题,采集并建立了越南语情感数据库。母语为越南语的两名男性和两名女性说话人进行了越南语情感语音的表演和录制,通过多人听辨实验进行了数据的验证和评选,建立了一个初步的越南语语音情感数据库,为今后的跨语言研究提供数据基础。在所获得的情感数据上,提取了基本的语音特征,并构造了可用于情感识别的静态统计特征。采用高斯混合模型进行了建模与识别,识别结果显示,本文中的系统能够较好的识别越南语语音情感。在今后的工作中,可以进一步研究跨语言情感特征的分析与识别。   相似文献   

5.
利用话音信号在进行信源编码后数据流中的特征,可以识别数字话音数据流的编码样式和参数.针对大量话音码流样本数据,利用统计分析方法给出自适应多速率(Adaptive Multi Rate,AMR)语音编码的背景噪声帧、零一分布、游程分布及参数分布等特征,在此基础上提出了基于学习的AMR语音编码识别方法,并给出AMR语音编码的特征模型,通过计算机仿真比较了话音帧分析法和统计特征分析法在不同误码条件下的识别性能.  相似文献   

6.
董航  孙洪 《信号处理》2005,21(Z1):223-226
本文在分析统计信号贝叶斯模型和语音信号的时变自回归(TVAR)模型的基础上,利用蒙特卡洛滤波及平滑方法,对语音信号的TVAR模型参数进行了估计,提出了一种有效的针对非平稳加性噪声影响下的语音增强算法.该算法可以很好的跟踪非平稳信号,同时引入对反射系数的判断,保证了跟踪的稳定性.实验表明,本文方法能很好的抑制背景噪声,提高信噪比,改善语音信号的听觉质量.  相似文献   

7.
钱兆鹏  肖克晶  刘蝉  孙悦 《电子学报》2020,48(5):840-845
电子喉语音存在基频单一、发声机械、辐射噪声大等多种缺陷,这严重影响了电子喉语音可懂度和自然度,特别是对汉语普通话之类的声调语言,问题尤其严重.汉语普通话电子喉语音识别存在辅音混淆的问题并且识别结果没有声调,因此本文在识别结果的基础之上设计了拼音拼写修正器和声调标注工具,再结合基于Tacotron-2的TTS实现了电子喉语音向正常语音的转换.客观评价实验结果表明,拼音拼写修正器可以提高拼音准确率,声调标注在有上下文的语义环境中具有较高准确率.主观听力测试结果表明,本文所提方法在不同语言水平上提高了汉语普通话电子喉语音的可懂度和自然度.研究结果表明,本文设计的方法可以将不带声调的电子喉语音转换为正常语音,相比于传统语音转换方法具有更高的性能.  相似文献   

8.
《现代电子技术》2021,(1):149-152
为了获得更加理想的普通话测试效果,针对当前计算机辅助普通话测试系统存在的不足,设计了复杂环境下的计算机辅助普通话测试系统。首先构建计算机辅助普通话测试系统的总体流程;然后重点设计软件子系统,该子系统引入小波变换对采集的普通话测试者语音信号进行预处理,去除外界环境对普通话测试结果的干扰,并引入人工智能技术对预处理后的普通话测试者语音信号进行自动识别,获得普通话测试结果;最后通过仿真实验测试了所提系统的性能,结果表明,相对于其他计算机辅助普通话测试系统,该设计系统的计算机辅助普通话测试精度得到大幅度提升,对外界环境的鲁棒性更强,可以更好地满足普通话测试要求,具有更高的实际应用价值。  相似文献   

9.
对语音数据库进行标注的目的是为语言工程和与语音研究提供可靠的数据。对语料库进行统计的方法一直是目前语音分析和语音技术的主流;同时,语音的基础研究,也很少使用实验室语音进行定性分析,而趋向采用大量自然语料的定量统计分析,所以语音数据库的标注显得尤为重要。  相似文献   

10.
齐峰岩  鲍长春 《电子学报》2006,34(4):605-611
本文将支持向量机(SVM)方法应用于语音信号的清/浊/静音检测中,提出并验证了一种在各种信噪比等级下将语音信号有效地分为清音、浊音和静音三类信号的新型分类算法.首先,在高信噪比情况下,本文采用了G.729B VAD中的四个差分参数作为SVM分类器的输入特征参数,进行了静音分类的对比实验,得到了优于G.729B VAD和BP神经网络传统算法的实验结果,说明引入这种机器学习方法做语音分类是可行的,并分析讨论了在核函数不同的情况下支持向量机在实验中所表现出的性能.其次,又讨论了在低信噪比条件下,如何通过对含噪语音建立统计模型,提取对噪音免疫的统计特征参数,并给出了一种对时变背景噪声自适应的估计方法.最后,通过在不同噪音环境下的对比实验结果,验证了本文所提出的算法在中低信噪比情况下的分类性能要优于其他传统算法.  相似文献   

11.
本文对加拿大女作家艾丽斯?芒罗的短篇小说《逃离》进行分析,从三个方面探讨了女性在男性社会里内心的挣扎:强权男性形象、女性意识的觉醒和温和暴政下的隐秘内心。简单的故事情节揭示出普通女性敏感、无奈的心理状态,同时表现了女性的生活状态。  相似文献   

12.
齐峰岩  鲍长春 《信号处理》2005,21(Z1):172-175
本文提出了一种对于不同背景噪音具有鲁棒性的语音激活检测(VAD)算法.首先,该算法基于统计模型理论、线性预测原理以及自适应时变噪声参数估计方法,在时域和频域中共提取了四个特点不同的特征参数作为分类器的输入特征矢量,然后应用支持向量机(SVM)的方法,进行语音激活检测.最后,通过在不同噪音环境下的对比实验结果,验证了本文所提出的算法在中低信噪比情况下的检测性能要优于ITU G.729B中的VAD算法.  相似文献   

13.
本文阐述了一种新的全汉语单音节语音识别算法一DP/MVQ法.新方法充分借鉴了隐马尔可夫模型(Hidden Markov Model)中“状态”的概念,保留了David K.Bordon提出的多段矢量量化(Multisection Vector Quantization,简记为MVQ)方法中能保持时间序列信息的优点,并且在码本的训练过程中用了动态规划(Dynamic Programming)技术去优化MVQ产生的码字,使得DP技术贯穿于码本训练和识别的全过程。新方法充分考虑了汉语普通话语音的声学结构特点和统计特性,而且训练和识别均较快,码本尺寸也较小.新方法着重于基于DSP硬件的实时实现,以便于能用语声控制汉字的计算机输入。  相似文献   

14.
基于DCT与维纳滤波的单通道语音增强算法   总被引:5,自引:0,他引:5  
针对复杂噪声背景下的语音增强问题,基于离散余弦变换(DCT)和维纳滤波提出了一种新的单通道语音增强算法。该算法不依赖任何语音信号模型且无需对噪声的统计特性进行先验假定,它利用DCT域中连续时刻语音信号分量间的相关特性结合最小均方误差算法实现纯净语音分量的最优估计,弥补了一般算法仅依赖单帧带噪语音对语音分量估计得不足。多种噪声背景下的仿真结果表明,该算法在主观和客观测试中都具有良好的语音增强效果。  相似文献   

15.
朱唯鑫  郭武 《信号处理》2016,32(7):859-865
本文首次提出了长度规整的最大后验估计(MAP)方法,并将其应用到说话人分割聚类中的交叉似然比(CLR)和T Test这两种度量距离上。传统的MAP方法需要在通用背景模型(UBM)基础上进行统计量的计算,进而对模型参数进行自适应偏移,因此偏移的程度与语音片段的长度正相关。当在度量两个长度不相同的语音片段的相似性时,传统的MAP方法会使得说话人模型刻画不准确,从而影响距离度量。本文在MAP过程中,根据语音的长度对相关因子进行规整,然后再进行模型参数的调整,从而使得模型参数与语音长度无关,更能体现说话人的身份信息。在中文多人电视访谈节目数据的分割聚类评测任务上,采用长度规整的MAP方法相对于传统方法都有明显提升,在CLR度量准则下分割聚类错误率相对下降了35%,在T Test度量准则下分割聚类错误率相对下降了107%。   相似文献   

16.
话音突发信号与话音沉默信号持续时间的统计特性不仅是确定时间分配话音插空(TASI)系统和数字话音插空(DSI)系统的系统增益的依据,也是在分析小规模中继线组TASI系统过载剪截(freezeout)工作状态过程所必不可少的数据。本文给出了汉语普通话持续时间的统计特性。在TASI和DSI系统中普遍给话音突发佔号施加一定的笼罩(hang over)时间,该值一般在20ms至500ms之间。TASI系统的笼罩时间要远远地大于DSI系统的笼罩时间。本文不仅从理论上分析了笼罩时间对话音信号持续时间的影响,并且给出施加笼罩措施后汉语普通话话音持续时间的统计特性。  相似文献   

17.
双通道能量差后滤波语音增强算法在语音通信系统的噪声抑制技术中有较好的应用前景,然而其理论性能和局限性还未得到充分研究。为此,本文采用统计分析方法研究了双通道能量差后滤波语音增强算法的性能,分析了相干性、平滑因子及噪声估计误差对算法的影响。理论和仿真结果表明,噪声估计误差和平滑因子严重影响该算法的降噪性能。依据此分析结果,本文提出一种基于非平稳噪声估计和功率谱自适应平滑的双通道能量差后滤波算法。测试结果表明,本文提出的算法在不增加语音失真的前提下,能更有效地抑制非平稳噪声,段信噪比提高(SegSNRI)和语音质量感知评估(PESQ)等客观评价指标都表明本文的算法优于其它几种经典的后滤波算法。   相似文献   

18.
改进的基于信号子空间的多通道语音增强算法   总被引:3,自引:0,他引:3       下载免费PDF全文
欧世峰  赵晓晖  顾海军 《电子学报》2005,33(10):1786-1789
通过同时对角化麦克风阵列接收信号中语音信号和噪声信号的全局协方差矩阵,本文改进了一种基于信号子空间分解的多通道语音增强算法.该算法不依赖任何信号模型且无需对噪声信号的统计特性进行任何先验假定,它弥补了原始算法只限于白噪声背景下语音增强的不足,实现了色噪声背景下语音信号的最优估计.仿真结果表明本文算法在主观和客观测试中都具有良好的语音增强效果.  相似文献   

19.
语音识别的互信息匹配模型及其应用   总被引:3,自引:1,他引:2  
俞一彪  赵鹤鸣 《通信技术》2001,(8):39-42,72
互信息是随机变量或随机信号之间所携带对方信息的定量描述。语音识别的互信息匹配模型依据互信息理论以及语音信号特征参数统计分析结果而提出,这一模型同时考虑了语音信号的时变发布特征和统计分布特征,能有效地提高同类模式的凝聚度,减少非同类模式间的耦合性。语音识别实验和实际应用表明,互信息匹配模型具有良好的识别精度和很高的运行效率,与其它模式匹配方法相比更适合嵌入式系统的语音识别应用。对互信息匹配模型的原理和特点进行了全面的阐述,并介绍了这一模型在几个语音识别系统中的具体应用。  相似文献   

20.
语音识别的发展现状   总被引:5,自引:0,他引:5  
语音识别基础让机器听懂人类的语音,这是人们长期以来梦寐以求的事情。语音识别是一门交叉学科,关系到多学科的研究领域,不同领域上的研究成果都对语音识别的发展作了贡献。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。计算机语音识别过程与人对语音识别处理过程基本上是一致的。目前主流的语音识别技术是基于统计模式识别的基本理论。一个完整的语音识别系统可大致分为三部分:(1)语音特征提取:目的是从语音波形中提取随时间变化的语音特征序列。(2)声学模型与模式匹配(识别算法):声学模型是识别系…  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号