期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

基于熵函数的语音端点检测方法 总被引：8，自引：0，他引：8

陈四根《声学与电子工程》2001,(1):28-30

根据语音信号的波形特征,利用熵函数的性质,构造了一种特殊的熵函数,通过判断此函数值的大小确定是语音还是无声状态。实验表明,此方法计算简单而且具有很高的准确性。相似文献

2.

语音信号端点检测的实验研究

程启明《声学与电子工程》1997,(3):29-31

语音信号的端点检测一般都采用短时平均过零率和短时平均能量两参数判定,仅靠某一参数一般难以把噪声、清音和浊音区分开.本文通过理论分析和实验研究证明,仅靠短时过零率参数,只可以把清音和浊音区分开,但无法把清音和噪声有效地区分开. 相似文献

3.

神经网络方法及其在语音识别中的应用 总被引：2，自引：0，他引：2

胡瑞敏薛东辉《高技术通讯》1995,5(6):11-15

讨论了神经网络技术用于汉语语音信号的端点检测，声，韵母分离、非线性特征抽取和大字表识别的方法，描述了系统实现框图并给出了应用实例。相似文献

4.

一种噪声环境下的语音端点检测方法

下载免费PDF全文

王文延曾庆宁李琴赵中华《声学技术》2007,26(3):435-441

利用短时过零率来检测清音,用短时能量来检测浊音,两者相配合便实现了信号信噪比较大情况下的端点检测。但是在信噪比较小的环境下,这两种方法便失去了作用。为了能在噪声环境下准确地检测出语音信号的端点,根据对含噪语音在时频域中的研究,提出了一种基于Matching pursuits时频分解算法的语音端点检测方法。该方法使用Matching pursuits算法对含噪信号进行分解,然后再对信号进行魏格纳变换,可以完全去除信号的魏格纳交叉干扰项,使得语音信号和噪声信号在时频平面上具有较直观明显的魏格纳能量分布,利用这个特点再进行端点检测,实验结果表明,该方法能在信噪比较低的情况下,准确地检测出语音信号的端点。相似文献

5.

开发ActiveX控件实现语音端点的实时检测

杜文龙徐雪峰《计量与测试技术》2007,34(2):19-20

研究一种以过零率和能量为特征参数,利用VC 开发ActiveX控件,并结合MATLAB实现语音端点检测的方法. 相似文献

6.

短时能频值在语音端点检测中的应用 总被引：3，自引：0，他引：3

李桦安钢樊新海《测试技术学报》1999,13(1):21-27

本文研究了一种利用短时能频值进行语音端点检测的方法,它区别于传统的分别用短时能量和短时平均过零率作是否超过阈值判断,再通过“与”和“或”运算判定语音端点的方法,而是把两者有机结合起来成烽三时能频值。为提高该方法对噪声的适应性,进一步引入了相对阈值的概念,它是两个时刻的语音采样的比值关系,具有相对意义。相似文献

7.

飞机舱音背景声下的鲁棒语音端点检测

雷鸣李学仁李果《振动与冲击》2008,27(10)

有效提取飞机舱音背景声下的语音信息对飞机失事原因调查十分重要.提出了基于统计模型的语音端点检测方法.利用高斯混合模型逐帧计算语音/非语音状态的输出概率,利用后向估计方法和平行非线性卡尔曼滤波器估计非平稳噪声帧.最后,通过似然比门限值的计算区分语音和非语音段.与目前典型的语音端点检测算法的对比实验表明,在飞机舱音背景声下,该算法具有较好的准确性、自适应性和鲁棒性. 相似文献

8.

一种基于相对自相关序列的语音端点检测法

下载免费PDF全文

李英方杰《声学技术》2006,25(3):230-234

在研究单边自相关序列(One-sided autocorrelation,OSA)和相对自相关序列(Relative autocorrelation sequences,RAS)的基础上,提出了一种基于相对自相关序列的语音信号的端点检测算法。该方法利用相对自相关算法能够消除噪声的原理,以语音信号相对自相关序列短时平均幅度代替双门限比较法中的语音信号短时平均幅度,以语音信号短时平均幅度代替语音信号的短时平均过门限率,实验表明,在低信噪比下检测精度要高于传统的双门限比较法。相似文献

9.

低信噪比环境下语音端点检测改进方法

下载免费PDF全文

王瑶曾庆宁龙超谢先明毛维《声学技术》2018,37(5):457-464

针对语音端点检测在低信噪比环境下普遍存在检测性能急剧下降的问题,提出一种将调制域(时间-频率域)谱减法和自相关函数相结合的语音端点检测算法。该算法首先利用调制域谱减法较好的消噪能力来提高含噪语音的信噪比;然后根据语音和噪声的自相关函数的主峰最大值和次大值之比差异较大的特性,结合基于对数能量和自相关函数的端点检测方法对消噪后的语音进行端点检测。实验结果表明,该算法在低信噪比的环境下能取得较好的端点检测效果,并具有较好的稳健性。相似文献

10.

基于FOA-SVM的超声信号端点检测

《中国测试》2016,(5)

在超声缺陷识别系统中,端点检测是确保缺陷准确识别的重要环节。为提高在实际探伤过程中端点检测的准确率,提出一种以果蝇算法优化支持向量机的端点检测方法。针对超声检测信号的特点,采用小波包变换提取反映该信号性质的特征向量。鉴于传统方法检出率不高及支持向量机(SVM)参数难确定的问题,利用果蝇算法(FOA)优化SVM的惩罚子和核参数,提高支持向量机建模准确度。试验结果表明:FOA-SVM模型的平均检出率达到97.5%,端点检测效果明显优于传统的双门限法、普通SVM模型和GA-SVM模型。相似文献

11.

一种低信噪比环境下的语音端点检测算法

下载免费PDF全文

卜玉婷曾庆宁郑展恒《声学技术》2020,39(5):592-602

端点检测技术是语音信号处理的关键技术之一，为提高低信噪比环境下端点检测的准确率和稳健性，提出了一种非平稳噪声抑制和调制域谱减结合功率归一化倒谱距离的端点检测算法。该算法首先通过抑制非平稳噪声再采用调制域谱减消除残余噪声来提升信噪比，减少语音失真。然后再提取每帧信号的功率归一化倒谱系数，计算每帧信号与背景噪声的功率归一化倒谱距离。最后将该倒谱距离作为检测参数，采用双门限判决方法进行端点检测。实验结果表明，该端点检测算法对语音帧和噪声帧具有较好的区分性。此外，在低信噪比环境下，所提出的算法对于不同类型的噪声都具有较好的稳健性。相似文献

12.

利用语音的频谱空间特征进行汉语抗噪语音识别的方法

下载免费PDF全文

张永锋田勇张阳《声学技术》2015,34(1):51-53

抗噪连续语音识别是当前汉语连续语音识别的重要研究领域。采用通过度量连续语音帧之间频谱的稳定性,将连续语音切分成份,再将切分结果(无论时间长短)变换为与时间无关的大小固定的频谱空间特征,通过与模板库进行比较实现语音识别。新的频谱空间特征,与语音时长无关,同时表现出较好的抗噪声能力。在特定人连续语音识别测试系统中,取得了不错的识别效果。相似文献

13.

基于双耳语音分离和丢失数据技术的鲁棒语音识别算法

下载免费PDF全文

周琳赵一良朱竑谕汤一彬《声学技术》2019,38(5):545-553

鲁棒语音识别技术在人机交互、智能家居、语音翻译系统等方面有重要应用。为了提高在噪声和语音干扰等复杂声学环境下的语音识别性能,基于人耳听觉系统的掩蔽效应和鸡尾酒效应,利用不同声源的空间方位,提出了基于双耳声源分离和丢失数据技术的鲁棒语音识别算法。该算法首先根据目标语音的空间方位信息,在双耳声信号的等效矩形带宽（Equivalent Rectangular Bandwidth,ERB）子带内进行混合语音信号的分离,从而得到目标语音的数据流。针对分离后目标语音在频域存在频谱数据丢失的问题,利用丢失数据技术修正基于隐马尔科夫模型的概率计算,再进行语音识别。仿真实验表明,由于双耳声源分离方法得到的目标语音数据去除了噪声和干扰的影响,所提出的算法显著提高了复杂声学环境下的语音识别性能。相似文献

14.

移动荷载作用下结构损伤的近似熵分析 总被引：1，自引：0，他引：1

下载免费PDF全文

王步宇俞亚南《振动与冲击》2010,29(6):125-128

当移动荷载接近或远离结构损伤部位时,结构的振动响应的幅值和非线性特征会发生变化,可以从中提取有关结构损伤的信息;近似熵可以表达一个时间序列的复杂性和内在模式。用移动荷载作用于结构上,对其振动响应数据进行近似熵计算,提取其非线性特征值,进而用神经网络进行结构损伤模式识别。通过一个移动荷载作用下简支梁的计算实例考察了这一方法的有效性。移动荷载的作用,使得损伤造成的结构非线性特征更加显著;研究、计算与实测案例表明近似熵能够有效地表征信号的非线性程度,而且对噪声干扰的敏感度低,可以作为神经网络模式识别的特征向量。相似文献

15.

一种基于DOA分布信息熵加权的线谱目标检测方法

下载免费PDF全文

王学成王鲁军洪常委《声学技术》2021,40(1):117-122

针对常规宽带能量检测方法对低信噪比线谱目标检测性能较差的不足,文章在分析目标线谱波达方向(Direction of Arrival,DOA)估计分布信息熵的基础上,提出一种基于DOA分布信息熵加权的线谱目标检测方法.通过仿真对比分析了该方法的检测性能,并利用海上实验数据验证了其有效性.结果表明,当目标方位较为稳定时,该... 相似文献

16.

融合人脸表情的手语到汉藏双语情感语音转换

下载免费PDF全文

宋南吴沛文杨鸿武《声学技术》2018,37(4):372-379

针对聋哑人与正常人之间存在的交流障碍问题,提出了一种融合人脸表情的手语到汉藏双语情感语音转换的方法。首先使用深度置信网络模型得到手势图像的特征信息,并通过深度神经网络模型得到人脸信息的表情特征。其次采用支持向量机对手势特征和人脸表情特征分别进行相应模型的训练及分类,根据识别出的手势信息和人脸表情信息分别获得手势文本及相应的情感标签。同时,利用普通话情感训练语料,采用说话人自适应训练方法,实现了一个基于隐Markov模型的情感语音合成系统。最后,利用识别获得的手势文本和情感标签,将手势及人脸表情转换为普通话或藏语的情感语音。客观评测表明,静态手势的识别率为92.8%,在扩充的Cohn-Kanade数据库和日本女性面部表情(Japanese Female Facial Expression,JAFFE)数据库上的人脸表情识别率为94.6%及80.3%。主观评测表明,转换获得的情感语音平均情感主观评定得分4.0分,利用三维情绪模型(Pleasure-Arousal-Dominance,PAD)分别评测人脸表情和合成的情感语音的PAD值,两者具有很高的相似度,表明合成的情感语音能够表达人脸表情的情感。相似文献

17.

基于脆性指数和熵权理论的岩体可爆性分级方法

《工程爆破》2022,(5)

为提升岩体可爆性分级的准确性用以指导爆破作业,将岩石脆性作为反映岩石爆破特性的指标之一,选取岩石单轴抗压强度与单轴抗拉强度比值作为岩石脆性指数,将岩石脆性指数、岩石容重、完整系数、动载强度作为岩体可爆性分级指标,运用熵权法建立属性识别模型,进行岩体可爆性分级。结果表明,脆性指数作为可爆性分级指标是合理的;采用熵权法进行岩体可爆性分级,降低了各指标权重计算的人为干扰,更加客观实际。相似文献

18.

高声强声源及其应用 总被引：4，自引：0，他引：4

谷嘉锦《声学技术》1997,16(1):9-13

本文介绍了４种高声强声源：１．单孔旋转阀；２．带中心杆的哈特曼发声器阵；３．喷流点声源；４．喷流反馈旋转发声器。本文还给出４种声源的用途，即分别应用于：１．流动管道中有限振辐波的传播研究；２．进气道吸声内衬的声阻抗测量技术；３．风洞声学环境的研究；４．利用高强的能来清灰除尘。相似文献