首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
针对基于局部二值模式的伪装语音检测方法的合成语音检测准确度较低的情况,提出了一种基于中心对称局部二值模式的伪装语音检测方法。该方法通过短时傅里叶变换得到语音信号的语谱图,再利用中心对称局部二值模式提取语谱图的纹理特征,并用该纹理特征训练随机森林分类器,从而实现真伪语音的判别。该方法综合考虑语谱图中像素点的数值大小和位置关系,包含了更加全面的纹理信息,并将特征维度降低至16维,有利于减少计算量。实验结果表明,在ASVspoof 2019数据集上,与传统的基于局部二值模式的伪装语音检测方法相比,所提方法将合成伪装语音的串联检测代价函数(t-DCF)降低了16.98%,检测速度提高了89.73%。  相似文献   

2.
徐嘉  简志华  金宏辉  吴超 《电信科学》2023,(11):107-115
针对传统的声学特征参数对合成语音伪装检测时存在的准确度低、未知类型合成语音检测效果较差、在噪声环境中表现欠佳的情况,提出了一种采用恒Q调制包络(constant Q modulation envelope,CQME)的合成伪装语音检测方法。该方法基于语音时域包络中包含的丰富信息,而合成语音与真实语音的包络在细节上存在较大差异,利用恒Q变换(constant Q transform,CQT)得到语音调制包络谱,并计算每个频率成分的均方根,获得CQME特征向量。再用该特征向量训练随机森林分类器,实现真伪语音的判别。实验结果表明,在ASVspoof 2019数据集上,CQME特征训练的随机森林具有较高的检测性能,对未知类型的合成语音也具有较好的检测效果。并且在多种噪声条件下,该方法仍表现出较高的检测性能,具有很好的噪声鲁棒性。  相似文献   

3.
语音端点检测在语音识别系统中占有重要地位。针对在噪声多变的环境中实时截取完整语音信号存在困难,文章提出一种实时语音端点检测方法。该方法首先提取每帧信号的短时平均过零率与Mel频率倒谱系数;然后利用前N帧背景噪声的Mel频率倒谱系数对当前帧进行归一化,并以该特征矢量的L2范数作为另一特征;最后根据多特征分析对有效语音信号进行截取。实验结果表明,该方法在多变的噪声环境中,截取完整语音信号具有较高准确率。  相似文献   

4.
《现代电子技术》2017,(12):28-30
针对英文语音发音标准化评价准确性不高的问题,提出一种基于发音特征倒谱系数感知的英文语音发音标准化的模式识别对比方法。首先构建英文语音发音的语音信号采集模型,对采集的英文语音信号进行发音器官的动作属性配对描述。然后提取英文语音发音信号的倒谱特性,采用梅尔频率倒谱系数感知方法进行英文语音发音特征建模和发音位置及方式的模式识别,为语音发音提供标准化对比模式。最后进行实验分析,测试结果表明,采用该方法进行英文语音发音特征检测和模式识别的准确度较高,对发音特征的声学建模有效可靠。  相似文献   

5.
邓智恒  罗伟栋 《电声技术》2007,31(9):61-65,69
由于没有可比对的语音源信号,如何评价实际语音盲分离的效果非常困难。目前还没有相应的客观评价指标。将语音特征引入实际语音盲分离评价指标,提出了基于信号相关性和Mel倒谱系数高斯混合模型的听觉-独立性联合指标,客观评价了实际语音盲分离的性能。  相似文献   

6.
该文提出了一种将模糊C-均值聚类法与矢量量化法相结合进行说话人识别的方法。该算法将从语音信号中提取的 12阶 LPC(线性预测编码)倒谱系数作为待分类样本的 12个指标,先用矢量量化法求出每个说话人表征特征参数的码书,作为模糊聚类算法的聚类中心,最后将待识别的特征矢量以得到的码书为聚类中心,进行聚类识别。该算法所使用的特征参数较少,计算比较简单,但识别率较矢量量化法高。  相似文献   

7.
由于语音合成的便利性,合成伪装语音对说话人认证系统的安全构成了很大的威胁。为了进一步提升说话人认证系统的伪装语音检测能力,提出了一种利用语谱图频域信息的合成语音检测方法,它通过局部相位量化算法对语谱图频域信息进行描述。首先,将语谱图分为若干子块,然后对每个子块进行局部相位量化,经直方图统计分析后获得局部相位量化特征向量并将该特征向量作为随机森林分类器的输入特征,实现合成语音检测。实验结果表明,该方法进一步降低了合成语音检测系统的串联检测代价数值,并且具有更强的泛化能力。  相似文献   

8.
盛春明 《电声技术》2022,(8):118-123+128
重放语音欺骗攻击是自动说话人验证系统(Automatic Speaker Verification,ASV)面临的严重威胁。目前,基于常数Q变换倒谱系数(Constant Q Cepstral Coefficients,CQCC)和梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)的检测模型存在检测性能不理想、泛化能力差等问题。对此,提出一种基于分数阶傅里叶变换(Fractional Fourier Transformation,FrFT)和K-均值聚类的无监督重放语音检测模型。首先利用FrFT将语音信号转换至分数域,然后提取分数域双谱特征构成特征向量,并利用K-均值聚类算法进行聚类分析,实现重放语音检测。基于ASVspoof2019公开数据集的试验结果表明,所提方法相对于CQCC和MFCC两种传统方法在t-DCF和EER两项指标方面分别提升超过6.52%和7.76%,并且作为一种无监督模型,不需要训练样本即可实现检测,在少样本情况下仍然能够获得较高的检测性能,泛化能力更强。  相似文献   

9.
语音识别指利用计算机识别语音信号所表达的内容,其目的是要准确地理解语音所蕴含的含义。本文着重研究了语音识别实现过程的特征提取,针对特征提取的多种方法,选用LPC倒谱系数作为特征参数提取,较彻底地去除了语音信号产生过程的激励信息,主要反映了声道模型,而且只需十几个倒谱系数就较好地描述了语音的共振峰特性。通过对语音信号进行预加重、分帧、加窗、自相关分析,而后提取出LPC倒谱系数。根据流程编写VC程序,对语音信号进行分析处理,去除对语音识别无关紧要的冗余信息,从而获得用于语音识别的重要信息。  相似文献   

10.
针对梅尔倒谱系数特征难以满足短语音说话人确认的问题,本文从同样是模仿人耳听觉机理的伽马通滤波器为基础,提出让抗噪性能更佳的伽马通频率倒谱系数作为输入特征.首先,在短语音条件下,提取伽马通频率倒谱系数,采用加减特征分量法计算其不同维数的贡献度大小.其次,选取其中贡献较高的分量作为特征,保留那些最能表征不同说话人之间差异的...  相似文献   

11.
语音转换是一项非常复杂的技术,语音特征参数的选取是语音转换能否成功的关键。本文基于语音信号个性特征,主要针对超音段特征和音段特征的特征参数基频、Mel倒谱系数和共振峰通过理论和实验对它们各自的性能进行分析研究。  相似文献   

12.
语音转换是一项非常复杂的技术,语音特征参数的选取是语音转换能否成功的关键。本文基于语音信号个性特征,主要针对超音段特征和音段特征的特征参数基频、Mel倒谱系数和共振峰通过理论和实验对它们各自的性能进行分析研究。  相似文献   

13.
彭涛  俞一彪 《信息技术》2008,32(1):80-82
结合传统中医理论和现代信号处理技术以脉象信号的LPC系数、LPC倒谱系数和MEL频率倒谱参数作为识别的特征矢量,运用VQ模型对胃癌、肺癌、乳腺癌等病症患者的脉象信号进行建模以及识别的研究.此研究为病症脉象识别和辅助诊断疾病提供了一种有效的方法.  相似文献   

14.
本文根据倒谱系数矢量在特征空间的统计分布特性,提出了一种新的等方差加权倒谱失真测度,这种测度的加权函数充分刻画了语音倒谱矢量在特征空间分布的精细结构,从而有效地辨识不同讲话者的特征,实验表明,和常规的欧氏距离及方差倒数加权距离等相比,本文所提的失真测度能显著提高基于矢量量化的说话人识别的正识率。  相似文献   

15.
噪声环境下,为了提高说话人识别系统的鲁棒性,需要对系统进行各种抗噪声处理。采用梅尔频率倒谱系数作为语音的特征参数,矢量量化方法进行模式匹配,将改进的基于听觉掩蔽效应的语音增强器作为预处理器,对语音信号首先进行降噪处理。语音增强器实验结果表明,经过降噪处理后提高了输入信号的信噪比,减少了语音失真,同时很好地抑制了背景噪声和残余音乐噪声。将经过降噪处理的语音信号送入说话人识别系统,提高了系统的识别性能。  相似文献   

16.
建立了一种基于自组织神经网络的语音识别系统。对语音信号进行了预处理,提取了语音信号的线性预测系数、线性预测倒谱系数和Mel倒谱特征系数,建立了基于自组织神经网络的识别判决模型。深入分析和改进了自组织神经网络的分类聚类能力,通过加强训练和设定阈值函数的方法,有效地确定了边界神经元的归属,划分出了合理的输出模式类。验证了自组织神经网络适合于处理孤立词语音识别,并具有快速性和结构简单等特征。MATLAB仿真实验表明,语音识别率达到96%。  相似文献   

17.
极化SAR地物分类作为极化SAR数据解译的关键环节,已成为遥感领域研究的一个新热点。在充分研究现有方法的基础上,给出了一种联合特征和SVM相结合的极化SAR图像分类方法。该方法基于目标分解理论提取极化SAR图像的多类散射特征,并结合具有上下文知识的纹理特征,构建联合特征矢量;利用提取样本区域像素的联合特征矢量训练SVM分类器;将未知数据输入训练好的分类器完成最终的分类。实测SAR图像数据的实验结果表明,算法能够充分利用极化SAR图像电磁散射特性及纹理特征的互补性,具有较好的分类性能。  相似文献   

18.
《现代电子技术》2019,(9):60-64
针对恶意网址检测系统的特征选择和降维问题,基于特征选择方法的优化结果提出多种特征子集。利用基于分类器的准确率和召回率等性能评价指标,采用随机森林、贝叶斯网络、J48、随机树机器学习方法,对信息增益、卡方校验、信息增益率、基于Relief值、基于OneR分类器、基于关联性规则、基于相关性等多种特征选择算法所确定的特征子集进行检测。结果表明,除基于相关性特征选择算法确定的特征子集外,其他方法确定的特征子集均具有良好的分类性能,其中基于关联性规则选择的特征子集的维度仅为5,但各分类器基于此特征子集的分类准确率均高达99%以上。  相似文献   

19.
ZPW-2000A型轨道电路是我国铁路信号系统中广泛使用的设备,针对ZPW-2000A型轨道电路发送器、接收器故障排查程序复杂、效率低的问题,提出一种基于声谱分析的故障诊断方法,实现非接触故障诊断。首先,通过梅尔频率倒谱系数和小波包分析对采集的轨道电路发送器、接收器故障时的声音信号进行特征提取,获得多维特征矩阵;然后,利用支持向量机和随机森林作为分类器,将故障诊断转化为多分类问题,实现发送器与接收器的故障分类。研究结果表明,以支持向量机作为分类器的平均准确率为89.4%,随机森林作为分类器的平均准确率为95.4%,可以实现故障的准确识别。  相似文献   

20.
论文通过提取输入语音的美尔倒谱系数,线性预测倒谱系数及其差分的双重方法,在建模过程中,对原有的矢量量化模型进行改进,形成一种新的连续码字分布的矢量量化模型,并与传统的动态时间规整算法和矢量量化方法比较,进行与文本有关的说话人识别实验,获得了较好的效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号