共查询到20条相似文献,搜索用时 15 毫秒
1.
针对基于局部二值模式的伪装语音检测方法的合成语音检测准确度较低的情况,提出了一种基于中心对称局部二值模式的伪装语音检测方法。该方法通过短时傅里叶变换得到语音信号的语谱图,再利用中心对称局部二值模式提取语谱图的纹理特征,并用该纹理特征训练随机森林分类器,从而实现真伪语音的判别。该方法综合考虑语谱图中像素点的数值大小和位置关系,包含了更加全面的纹理信息,并将特征维度降低至16维,有利于减少计算量。实验结果表明,在ASVspoof 2019数据集上,与传统的基于局部二值模式的伪装语音检测方法相比,所提方法将合成伪装语音的串联检测代价函数(t-DCF)降低了16.98%,检测速度提高了89.73%。 相似文献
2.
针对传统的声学特征参数对合成语音伪装检测时存在的准确度低、未知类型合成语音检测效果较差、在噪声环境中表现欠佳的情况,提出了一种采用恒Q调制包络(constant Q modulation envelope,CQME)的合成伪装语音检测方法。该方法基于语音时域包络中包含的丰富信息,而合成语音与真实语音的包络在细节上存在较大差异,利用恒Q变换(constant Q transform,CQT)得到语音调制包络谱,并计算每个频率成分的均方根,获得CQME特征向量。再用该特征向量训练随机森林分类器,实现真伪语音的判别。实验结果表明,在ASVspoof 2019数据集上,CQME特征训练的随机森林具有较高的检测性能,对未知类型的合成语音也具有较好的检测效果。并且在多种噪声条件下,该方法仍表现出较高的检测性能,具有很好的噪声鲁棒性。 相似文献
3.
4.
5.
由于没有可比对的语音源信号,如何评价实际语音盲分离的效果非常困难。目前还没有相应的客观评价指标。将语音特征引入实际语音盲分离评价指标,提出了基于信号相关性和Mel倒谱系数高斯混合模型的听觉-独立性联合指标,客观评价了实际语音盲分离的性能。 相似文献
6.
7.
8.
重放语音欺骗攻击是自动说话人验证系统(Automatic Speaker Verification,ASV)面临的严重威胁。目前,基于常数Q变换倒谱系数(Constant Q Cepstral Coefficients,CQCC)和梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)的检测模型存在检测性能不理想、泛化能力差等问题。对此,提出一种基于分数阶傅里叶变换(Fractional Fourier Transformation,FrFT)和K-均值聚类的无监督重放语音检测模型。首先利用FrFT将语音信号转换至分数域,然后提取分数域双谱特征构成特征向量,并利用K-均值聚类算法进行聚类分析,实现重放语音检测。基于ASVspoof2019公开数据集的试验结果表明,所提方法相对于CQCC和MFCC两种传统方法在t-DCF和EER两项指标方面分别提升超过6.52%和7.76%,并且作为一种无监督模型,不需要训练样本即可实现检测,在少样本情况下仍然能够获得较高的检测性能,泛化能力更强。 相似文献
9.
语音识别指利用计算机识别语音信号所表达的内容,其目的是要准确地理解语音所蕴含的含义。本文着重研究了语音识别实现过程的特征提取,针对特征提取的多种方法,选用LPC倒谱系数作为特征参数提取,较彻底地去除了语音信号产生过程的激励信息,主要反映了声道模型,而且只需十几个倒谱系数就较好地描述了语音的共振峰特性。通过对语音信号进行预加重、分帧、加窗、自相关分析,而后提取出LPC倒谱系数。根据流程编写VC程序,对语音信号进行分析处理,去除对语音识别无关紧要的冗余信息,从而获得用于语音识别的重要信息。 相似文献
10.
11.
12.
13.
结合传统中医理论和现代信号处理技术以脉象信号的LPC系数、LPC倒谱系数和MEL频率倒谱参数作为识别的特征矢量,运用VQ模型对胃癌、肺癌、乳腺癌等病症患者的脉象信号进行建模以及识别的研究.此研究为病症脉象识别和辅助诊断疾病提供了一种有效的方法. 相似文献
14.
本文根据倒谱系数矢量在特征空间的统计分布特性,提出了一种新的等方差加权倒谱失真测度,这种测度的加权函数充分刻画了语音倒谱矢量在特征空间分布的精细结构,从而有效地辨识不同讲话者的特征,实验表明,和常规的欧氏距离及方差倒数加权距离等相比,本文所提的失真测度能显著提高基于矢量量化的说话人识别的正识率。 相似文献
15.
噪声环境下,为了提高说话人识别系统的鲁棒性,需要对系统进行各种抗噪声处理。采用梅尔频率倒谱系数作为语音的特征参数,矢量量化方法进行模式匹配,将改进的基于听觉掩蔽效应的语音增强器作为预处理器,对语音信号首先进行降噪处理。语音增强器实验结果表明,经过降噪处理后提高了输入信号的信噪比,减少了语音失真,同时很好地抑制了背景噪声和残余音乐噪声。将经过降噪处理的语音信号送入说话人识别系统,提高了系统的识别性能。 相似文献
16.
17.
18.
19.
ZPW-2000A型轨道电路是我国铁路信号系统中广泛使用的设备,针对ZPW-2000A型轨道电路发送器、接收器故障排查程序复杂、效率低的问题,提出一种基于声谱分析的故障诊断方法,实现非接触故障诊断。首先,通过梅尔频率倒谱系数和小波包分析对采集的轨道电路发送器、接收器故障时的声音信号进行特征提取,获得多维特征矩阵;然后,利用支持向量机和随机森林作为分类器,将故障诊断转化为多分类问题,实现发送器与接收器的故障分类。研究结果表明,以支持向量机作为分类器的平均准确率为89.4%,随机森林作为分类器的平均准确率为95.4%,可以实现故障的准确识别。 相似文献
20.
论文通过提取输入语音的美尔倒谱系数,线性预测倒谱系数及其差分的双重方法,在建模过程中,对原有的矢量量化模型进行改进,形成一种新的连续码字分布的矢量量化模型,并与传统的动态时间规整算法和矢量量化方法比较,进行与文本有关的说话人识别实验,获得了较好的效果。 相似文献