首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
陈雪勤  刘正  赵鹤鸣 《声学技术》2008,27(5):704-707
提出了一种具有较高精度且抗噪性能强的基音检测算法。该算法将线性预测残差看作语音源信号的近似,对其进行频谱分析,依据残差幅度谱算得基音周期的粗估值。然后回到时域信号,根据基音周期粗估值设计一长度可调的窗,通过窗函数在语音段连续取两段语音信号作相似度运算,可根据最大相似度值计算出准确的基音周期。该方法准确性高,在噪声环境下也具有较好的效果。  相似文献   

2.
针对传统小波-自相关算法在噪声环境下检测语音的基音周期会出现偏差和漏报的情况,提出一种经验模式分解下的小波-自相关的基音周期检测改进算法。该算法首先利用经验模式分解去除含噪语音趋势项并减噪,再利用改进的小波-自相关法突出每个基音周期的峰值点,提高了基音周期检测的精度。实验结果表明,该改进方法可有效改善加噪语音在基音提取上出现的偏差误报情况以及避免部分倍频和半频错误,提高基音周期检测速率及准确率。  相似文献   

3.
本文针对语音信号基音周期检测进行分析,并使用matlab软件编程实现了语音信号的基音周期检测.在实现基音周期检测时使用中心削波法,该方法使语音信号基音周期检测更为可靠,并采用了三电平削波法减少基于自相关法的基音周期检测的乘法运算量.  相似文献   

4.
描述了一种基于方差及线性回归的语音隐藏信息盲检测方法。该方法用语音质量评估参数生成一个多元线性回归模型.可对可疑的语音进行隐藏信息盲检测,语音质量评估参数种类和数量,可用方差分析法预先选择。该方法经计算机模拟。对常用的变换域信息隐藏方法有较好的检测效果。  相似文献   

5.
金赟  赵艳  黄程韦  赵力 《声学技术》2010,29(1):63-68
为了研究耳语音情感识别,制定了耳语音情感数据库的制作流程和制作规范,设计并建立了一个包含4000个单词、5000条语句和600个段落的耳语音情感数据库。利用模糊数学中的隶属度函数和层次分析法对语句的有效性进行了检验,得到一个满足研究要求的耳语音情感数据库。利用库中的语料进行初步的耳语音情感识别,得知正常音语音情感识别所用的音长、能量等参数,在耳语音中仍然可以使用;而正常音的其它涉及基音的一些参数,不适用于耳语音,需要进行改进或者提取新的特征参数。  相似文献   

6.
针对正弦激励线性预测(SELP)声码器在解码端使用整型基音周期会引入额外舍入误差的问题,提出了一种码本整型化修正算法,该算法通过对码本中的各个码字在线性域进行取整,达到与解码端反量化过程一致的效果。测试结果表明,该算法能够有效地降低基音周期对数域矢量量化的量化误差,并且能够将合成语音的平均意见得分(MOS)提高0.05左右,明显改善合成语音质量。  相似文献   

7.
一种新型的语音分析编辑合成系统   总被引:1,自引:1,他引:0  
作者根据语音研究的需要,研制了一套集语音采集,分析,合成,修改,比较,放音、调整为一体。通过参数修正,中值平滑,Hanning窗滤波,鼠标画线式,数值直接修改参数的语音分析,编辑,合成系统。该系统对语音研究来说,可以大大地缩短分析合成时间,提高效率,探导各种参数的作用,各种分析合成方法的优劣,对整个语音的研究有其使用价值。本文通过语音分析编辑合成系统的结构,功能,应用3个部分来介绍这套系统。  相似文献   

8.
一种基于线性预测和极大似然估计的基音检测算法   总被引:1,自引:0,他引:1       下载免费PDF全文
用线性预测的方法求出语音信号的LPC(Linear Predictive Coding)谱,然后根据候选的声门激励与LPC谱卷积重构语音信号的短时频谱,当重构频谱与原始语音频谱之间的畸变最小时,声门激励之间的间隔为基音周期.为了提高计算效率,采用频域动态搜索的方法搜索基音周期的候选值.数值实验表明,采用线性预测和极大似燃估计 (Maximum Likelihood, ML)的基音检测算法可保留更多的基音信息,并能有效地减少基音检测的错误,并且该算法比传统的ML法有更强的鲁棒性.  相似文献   

9.
基于线性预测的数字语音参数估计   总被引:2,自引:0,他引:2  
介绍了数字语音信号分析中的线性预测的基本原理。讨论了用线性预测估计基本语音参数的方法、并对实验仿真结果进行了分析,从实验分析结果可知:线性预测分析是一种估计精度较高、运算速度较快的语音参数估计方法。  相似文献   

10.
基于近似熵的语音端点检测   总被引:3,自引:0,他引:3       下载免费PDF全文
雷雄国  曾以成  李凌 《声学技术》2007,26(1):121-125
提高语音信号端点检测的正确率一直是语音识别领域的一个重要课题,特别是提高在各种实际噪声环境下语音端点检测的正确率更为重要,而传统的基于能量与过零率的方法在噪声环境下不能有效地工作。近似熵是一种新的度量序列复杂性的方法,它具有较强的抗干扰能力。从信号复杂性的角度提出了一种基于近似熵的带噪语音端点检测方法,证明了通过给定一个合理的阈值可以有效地进行语音端点检测。在不同类型噪声及不同信噪比环境下进行实验,结果表明,对语音信号起点和终点的检测性能均要比传统基于能量的方法要好,即使是在较低的信噪比下,该方法仍能够比较准确地检测出语音的起止端点。  相似文献   

11.
浊音端点检测在语音处理中占有重要地位,在语音编解码、语音识别、语音增强处理中都需要用到端点检测技术。常规的以短时能量、过零率等作为判决特征参数的方法无法在低信噪比的系统中满足应用需求。本文以信号的共振峰和基音周期检测为基础检测浊音端点,算法首先提取语音信号的第一共振峰以及基音周期信息并以此为判决依据判断浊音的起点和终点。实验证明,这种方法在噪声环境中相对于传统的基于能量检测的或AMR_WB标准中的端点检测算法有更高的正确率。  相似文献   

12.
沈彩凤  俞一彪 《声学技术》2013,32(4):305-311
提出一种新的连续语音的声调评测算法,该算法可应用于计算机辅助语言学习系统和普通话水平测试中的声调评测。考虑到连续语音声调受上下文之间的相互影响,采用三音节单元建立高斯混合模型(Gaussian Mixture Model, GMM),三音节中辅音部分用Spline插值法拟合声调曲线来反映音节间基音频率的转移信息,并利用Fujisaki模型去除语句的语调和说话人个性特征,只对基频曲线中的声调特征建模。实验结果显示,相比于传统方法,采用三音节Spline插值和Fujisaki改进特征的方法使得机器与人工打分的相似度在测试集中分别提高了8.75%和14.09%。  相似文献   

13.
基于熵函数的语音端点检测方法   总被引:8,自引:0,他引:8  
根据语音信号的波形特征,利用熵函数的性质,构造了一种特殊的熵函数,通过判断此函数值的大小确定是语音还是无声状态。实验表明,此方法计算简单而且具有很高的准确性。  相似文献   

14.
首先介绍一种基于频带方差的语音活动检测(VAD)算法,然后在此基础上,给出一种对麦克风阵列各通道信号同时进行VAD的新算法(ICA—VAD):经ICA分离出的相对纯净的语音信号作为参考信号,其VAD结果用于指导阵列信号的语音检测。实验结果表明该方法在恶劣的噪声环境下仍可以获得准确的检测结果,且计算机模拟显示这是一种比较好的抗噪语音检测方案。  相似文献   

15.
黄程韦  金赟  赵艳  于寅骅  赵力 《声学技术》2010,29(4):396-399
针对实用语音情感研究的需要,设计并且建立了诱发语音情感数据库。根据刺激评估表,设计了一种基于计算机游戏的情感诱发方式,首次针对汉语音的实用语音情感进行了情感数据的采集和情感语音库的建立。对烦躁、紧张和喜悦等三种具有实际应用意义的语音情感进行了有效的诱发,录制了情感语音数据,并进行了数据的检验与听辩测试。结果显示,采用计算机游戏诱发情感的方法能够有效地采集自然度较高的实用语音情感数据,为实用语音情感的特征分析与识别提供了必要的研究基础。  相似文献   

16.
语音活性检测是语音增强中的一个重要问题。大部分的语音活性检测方法都是建立在相对理想的实验室条件下的.要求背景噪声保持平稳,信噪比较高,这些条件在实际噪声环境中很难满足。本文提出的基于Mel刻度短时能量差的语音活性检测算法,距离测度简单,物理意义叫确,在低信噪比、缓变非平稳噪声环境下,标定准确,鲁棒性好。将其应用在维纳滤波语音增强中的噪声特性估计上,取得了较为理想的效果。  相似文献   

17.
听觉掩蔽效应语音增强的改进算法   总被引:2,自引:1,他引:1  
于凤芹  阚仁根 《声学技术》2008,27(5):712-716
含噪信号利用掩蔽效应去噪后,噪声估计的误差导致语音失真。在利用听觉阈值计算谱减系数时提出了一种改进的计算方法,通过增加修改参数来抑制语音的过分衰减,减少了语音失真,然后基于MMSE准则对增强的语音谱再进行平滑处理,进一步抑制音乐噪声。实验表明该算法在不影响语音失真的基础上,提高了信噪比,消除了音-/乐噪声,主观测听的语音音质明显提高。  相似文献   

18.
本文提出了一种应用离散余弦/正弦变换提取语音信号基频的新方法,这种方法将语音信号的离散余弦变换或离散正弦变换的数据应用倒谱技术进行分析,从而测得语音信号的基频值,文中也给出从离散余弦变换谐波积变中取语言基频的方法,这两种方法应用简便,运算最小,可以获得满意的结果。  相似文献   

19.
动态时间规整方法是一种以动态规整为基础的模式匹配方法,在模式识别特别是语音识别领域中有着广泛的应用。本文介绍将动态时间规整方法应用于说话人识别的方案,实验研究的结果表明,动态时间规整方法应用于说话人识别是行之有效的,而且实验的错误率可以降低到静态时间规整说话人识别实验的错误率的一半。  相似文献   

20.
基于小波变换多阈值语音增强处理研究   总被引:2,自引:0,他引:2  
语音通信过程不可避免地会受到各种噪声的干扰,噪声降低了语音的信噪比和可懂度。语音增强就是对带噪语音进行处理,以改善语音质量。小波变换具有多尺度的特性,可以由粗及细的逐步观察信号。本文研究了一种基于小波多尺度特性的多阈值处理的语音增强算法,根据不同的尺度因子和位移因子选择不同的阈值,利用软阈值函数对带噪语音进行消噪,并比较分析了各种小波基处理带噪语音的不同效果。实验结果表明,该算法可以明显提高语音的信噪比,并提高了语音的清晰度和可懂度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号