共查询到20条相似文献,搜索用时 125 毫秒
1.
本文阐述了经典窗函数在时域及频域中的计算公式。并讲述了短时能量的作用和实际意义。文中对音频信号在不同窗函数截短后短时能量进行对比分析。理论研究及实验结果说明了短时能量能够直接区分音频信号中每个音节的位置,不同窗函数的选取直接影响短时能量值的大小。 相似文献
2.
SHI Hai- yan 《数字社区&智能家居》2008,(18)
语音信号端点检测是语音信号的预处理,正确的语音信号端点检测结果直接影响语音识别等后续工作的运算量和准确率。本文介绍了时域方法中基于短时能量的语音信号端点检测方法,并用三种不同的短时能量计算方式和五种短时能量阈值进行了端点检测实验。 相似文献
3.
基于短时能零熵的端点检测方法 总被引:1,自引:0,他引:1
端点检测技术是语音识别系统预处理阶段中的第一个关键技术,而传统的端点检测特征参数LPC距离、倒谱特征、TF参数和分形特征等参数的运算量太大,对硬件要求很高,阻碍了人机交互技术在日常生活中的普及。通过对语音信号三个端点检测的特征参数短时平均过零率、短时能量和基本谱熵逐一分析研究,提出了一种新型的语音参数——短时能零熵值,并作为主要参数应用于端点检测中。实验证明,短时能零熵值结合了信号的时域和频域语音特征,能够对背景噪声做出反馈、并且可以在复杂的背景噪音环境下对语音和非语音做出有效、稳定的区分,其端点检测的隔离度较大,具有稳健的抗噪特性。 相似文献
4.
语音端点检测是语音处理分析过程中的重要环节之一,该文介绍了语音端点检测的两个传统算法即短时平均能量和短时过零率,并将这两种算法结合起来进行藏语语音进行端点检测。运用Matlab编程和仿真验证了双门限判断法在藏语语音端点检测中的准确性。这种方法降低了藏语语音处理的时间、提高了处理的质量、可用来进行一些藏语语音识别的特征参数的提取。 相似文献
5.
语音端点检测是语音处理分析过程中的重要环节之一,该文介绍了语音端点检测的两个传统算法即短时平均能量和短时过零率,并将这两种算法结合起来进行藏语语音进行端点检测。运用Matlab编程和仿真验证了双门限判断法在藏语语音端点检测中的准确性。这种方法降低了藏语语音处理的时间、提高了处理的质量、可用来进行一些藏语语音识别的特征参数的提取。 相似文献
6.
7.
主要以汉明窗为例,定量分析了窗函数引起的信号幅度谱误差,给出了相对幅度谱补偿系数的理论值。对单频信号和噪声信号的计算机仿真分析验证了该补偿系数的正确性。此外,为进一步提高语音短时谱的分析质量,还给出了一种计算语音短时全相位DFT谱的方法,并通过计算机仿真验证了该方法的谱分析性能。 相似文献
8.
9.
端点检测的目的是从包含语音的一段信号中确定出语音的起点以及终点。文章介绍了短时能量和短时过零率的端点检测方法,研究了信息熵,并在此基础上构造了信息熵函数,提出了一种基于信息熵的端点检测算法。实验结果表明该算法具有良好的性能。 相似文献
10.
为了提高语音信号的识别率,提出了一种基于短时能量—LPCC的语音特征提取方法。该方法在LPCC参数的基础上,增加每帧信号的短时能量信息,使得新参数能够更为准确的表征语音信号。通过仿真实验,说明了新特征参数取得了较高的识别率。 相似文献
11.
12.
13.
针对高压静电除尘中会发生火花放电现象,降低除尘效率、损坏设备的问题,提出了根据火花放电造成的声音进行火花识别的方法,利用MEMS(Micro-Electro-Mechanical System)数字麦克风采集声音信号,分析了火花放电声音的短时能量、短时过零率、线性预测倒谱系数和梅尔频率倒谱系数(MFCC).建立BP神经网络识别系统,选用不同特征向量进行实验.研究结果表明:使用MFCC系数结合短时能量和短时过零率能提高识别率,对纯净样本的识别率高达96%,且用火花放电瞬间两帧数据作为火花样本进行BP神经网络训练能大幅度提高识别系统的鲁棒性,对非纯净样本的识别率高达95%. 相似文献
14.
针对基于短时能量和短时过零率的语音端点检测算法不能自适应环境,在低信噪比时性能较差问题,提出了一种新算法。该算法利用最小短时能量评估环境噪声,优化参数提取算法,提高了参数本身的抗噪能力和自适应能力,再通过参数融合有效平衡了音节之间的差异,放大了语音与噪声之间的差异,最后通过一个动态检测门限,实现了不同信噪比下的端点检测。 相似文献
15.
胡蜂攻击蜂群是蜜蜂养殖过程中的主要敌害之一,通过声音手段进行蜂群的监测管理是智慧养蜂业的重要手段。本文以意大利蜜蜂为研究对象,通过实验过程中采集到的胡蜂攻击蜂群的声学数据,从声音信号的声谱图特征分析出发,选择了短时能量、短时过零率、短时平均幅度、声音复杂度等9个声音特征参数,利用支持向量机技术进行模式识别建模。结果表明,在径向基核函数的支持下选择9维参数参与建模,精度可达到84.70%;利用主成分变换后的6维参数进行建模,精度可达到86.23%。利用随机森林分析技术对选择的9维变量进行分析,得到短时过零率、频谱质心、音频均匀度指数、短时平均幅度这4个参数对建模获得的重要性最大。 相似文献
16.
在语音信号的识别、去噪等过程中通常只需对有声段进行处理,并且对语音段和噪声段可能需要采取不同的处理方法。相关函数描述的是随机信号在不同时刻取值的关联程度,由于噪声的随机性,噪声的相关函数和语音的相关函数有很大的不同,利用此不同点可以进行语音的端点检测。基于此提出了自相关函数的语音端点检测方法,并对比了经典的双门限法--基于短时平均能量和短时平均过零率的双门限判决法。实验表明该方法具有较高的准确性,并且在较低信噪比下能取得比短时平均能量和短时平均过零率的判决法更好的效果。 相似文献
17.
18.
语音端点检测是语音识别系统的一个重要组成部分,特别是在噪声环境下,其准确性直接影响到语音识别系统的计算复杂度和识别性能。提出了一种在噪声环境下基于短时TEO能量的语音信号端点检测方法,采用了双门限-三态转换判决机制以保证算法在噪声环境下的端点检测准确性和对信号绝对幅度变化的稳健性。实验结果表明,与传统的短时能量法和谱熵法相比,该算法在低信噪比情况下具有更好的端点检测能力,显示了算法的优越性。 相似文献
19.
20.
广义Gamma模型是近年来新提出的一种语音分布模型,相对于传统的高斯或超高斯模型具有更好的普适性和灵活性,提出一种基于广义Gamma语音模型和语音存在概率修正的语音增强算法。在假设语音和噪声的幅度谱系数分别服从广义Gamma分布和Gaussian分布的基础上,推导了语音信号对数谱的最小均方误差估计式;在该模型下进一步推导了语音存在概率,对最小均方误差估计进行修正。仿真结果表明,与传统的短时谱估计算法相比,该算法不仅能够进一步提高增强语音的信噪比,而且可以有效减小增强语音的失真度,提高增强语音的主观感知质量。 相似文献