共查询到19条相似文献,搜索用时 62 毫秒
1.
2.
为了能较为全面地描述语音信号的特征信息,提高伪装检测率,提出了一种基于均匀局部二值模式纹理特征与常数Q倒谱系数声学特征相结合,并以随机森林为分类模型的伪装语音检测方法。利用均匀局部二值模式提取语音信号语谱图中的纹理特征矢量,并与常数Q倒谱系数构成联合特征,再用所获得的联合特征矢量训练随机森林分类器,从而实现了伪装语音检测。实验中,分别对其他特征参数以及支持向量机分类器模型所构建的几种伪装检测系统进行了性能对照,结果表明,所提联合特征与随机森林模型相结合的语音伪装检测系统具有最优的检测性能。 相似文献
3.
4.
5.
针对传统的声学特征参数对合成语音伪装检测时存在的准确度低、未知类型合成语音检测效果较差、在噪声环境中表现欠佳的情况,提出了一种采用恒Q调制包络(constant Q modulation envelope,CQME)的合成伪装语音检测方法。该方法基于语音时域包络中包含的丰富信息,而合成语音与真实语音的包络在细节上存在较大差异,利用恒Q变换(constant Q transform,CQT)得到语音调制包络谱,并计算每个频率成分的均方根,获得CQME特征向量。再用该特征向量训练随机森林分类器,实现真伪语音的判别。实验结果表明,在ASVspoof 2019数据集上,CQME特征训练的随机森林具有较高的检测性能,对未知类型的合成语音也具有较好的检测效果。并且在多种噪声条件下,该方法仍表现出较高的检测性能,具有很好的噪声鲁棒性。 相似文献
6.
本文针对单样本情况下传统人脸识别方法在姿态、表情和光照等变化下识别效果不佳的问题,提出一种基于单演主方向中心对称局部二值模式的单样本人脸识别模式的单样本人脸识别算法.首先用多尺度的单演滤波器提取人脸图像单演局部幅值和局部方向信息,并求取主方向,生成主方向模式图;然后用CS-LBP算子进行编码,得到特征;最后对不同单演尺度空间中的特征分块统计特征直方图并运用直方图相交进行分类识别.在AR、Extend Yale B人脸数据库的实验结果表明,该算法简单有效,对光照、表情、部分遮挡变化具有较好的鲁棒性. 相似文献
7.
如今互联网已经逐渐渗透到人们生活的诸多方面,成为日常通信的重要途径。信息隐藏作为一种通信技术,通过将秘密信息嵌入常见载体中以达到隐蔽通信的目的。图像隐写是利用图像作为载体进行信息隐藏的一门技术与科学,YASS(Yet Another SteganographicScheme that Resists Blind Steganalysis)通过随机选取图像的子块进行DCT变换和QIM信息嵌入,具有较高的安全性。文中通过引入图像的局部二值模式(LBP)这一概念,根据YASS算法特点,分析图像的局部纹理变化,改进局部二值模式,利用局部有序对比模式(LOCP)的特征进行隐写分析。通过大量实验表明,相比传统的YASS隐写分析,文中所提方法在分析检测正确率等方面都有更好的效果。 相似文献
8.
谱特征在语音情感识别中起到了重要的作用,然而现有的谱特征仍未能充分表达谱图中的语音情感信息.为研究语音情感与谱图之间的联系,提出了一种面向语音情感识别的Gabor分块局部二值模式特征(GBLBP)。首先,获取情感语音的对数能量谱;然后,采用多尺度,多方向的Gabor小波对对数能量谱进行处理,得到Gabor谱图;再次,对每张Gabor谱图进行分块,采用局部二值模式提取每个块的局部能量分布信息;最后,将提取到的所有特征级联,得到GBLBP特征。Berlin库上的实验结果表明:GBLBP特征的平均加权召回率比MFCC高了9%,识别性能显著优于众多谱特征,且与现有声学特征有较好的融合性。 相似文献
9.
10.
在定义局部边缘的基础上提出了局部边缘二值模式(LEBP),并结合Gabor滤波器将其扩展到多分辨率LEBP(MLEBP)。对传统的中心对称局部二值模式(CS-LBP)和方向局部二值模式(D-LBP)进行了改进,新描述符在不增加计算复杂度和提高特征维数的基础上,进一步融入了局部边缘信息。为验证新描述符的性能,采用3个通用的纹理图像库进行图像检索实验。结果表明,结合本文方法,明显提高了传统描述符的分辨能力。 相似文献
11.
诱导式卫星欺骗干扰可诱导航空器逐渐偏离预定航迹,难以被发现,因此及时有效地检测干扰是飞行安全的保障。在现有紧组合导航体制基础上,设计了一种基于误差估值累加开环校正的紧组合导航结构,并证明了其性能与传统闭环校正紧组合导航性能等效。在此结构中,将紧组合导航系统与自适应序贯概率比检测方法结合,提出了一种基于误差估值累加开环校正的诱导式欺骗检测方法,融合紧组合导航信息与其他不受欺骗影响的导航信息,构建欺骗检测统计量进行诱导式欺骗检测。仿真结果表明,开环校正结构可避免随时间累加的惯性导航系统误差所导致的组合导航滤波器发散问题,同时欺骗检测方法可进一步提高算法对“最坏”情形下微小诱导式欺骗的检测效果。 相似文献
12.
Currently, position check-in on mobile devices has become a fashionable social activity. Meanwhile, criminals probably tamper the geographical position (geo-position) information to provide an alibi. Therefore, it is of importance to identify the authenticity of geo-position. To our knowledge, many current methods for geo-position spoofing detection mainly rely on geo-position information in the database. However, these methods possibly fail in the case of missing prior information or lacking rich training samples. To address that challenge, this paper proposes an alternative manner for detecting the geo-position spoofing via camera sensor fingerprint. In particular, the camera sensor fingerprint is first extracted through the images posted by an inquiry user based on the well-designed denoising filter. Second, the authenticity of the geo-position is verified by comparing the consistency of the residual noise from newly-posted images with position check-in and the unique camera sensor fingerprint from an inquiry user. Finally, the extensive experiments are conducted on the image database, that empirically indicates the relevance of our proposed simple but effective method. 相似文献
13.
针对手机、电话的短语音文本无关说话人确认,本文设计了一种基于分类GMM-UBM(CGMM-UBM)的说话人确认系统。用k-means算法将训练背景模型的语音参数集分类成若干个子空间,并据此进行目标说话人语音数据的子空间分类,再采用GMM-UBM结构为每个子空间分别建立一个子系统,以各个子系统输出评分的线性加权作为系统的输出评分。分类后的模型可以采用较低的混合度,线性加权增强了贡献较大子空间对确认性能的作用。在NIST’03语音库上100个男性话者的实验表明,短语音条件下,分类系统的性能比不分类系统有显著的改进,运算效率较后者也提高很多。 相似文献
14.
15.
图像作为记录生活和储存信息的重要途径之一,是人对视觉感知的物质的一种再现,同时也是对现实场景的一种真实写照.面对海量的图像数据,如何准确高效的提取图像特征,获取有用信息,将信息转化为所需特征,是需要解决的问题.针对这一问题,本文提出的基于CSLBP模糊图像特征提取与检测方法很好的解决了这一问题.同时结合HOG特征提取与... 相似文献
16.
基于改进型双门限语音端点检测算法的研究 总被引:3,自引:0,他引:3
语音端点检测是语音信号处理过程中的一个重要步骤,其检测准确性直接影响语音信号处理的速度和效果.传统的基于双门限法语言检测技术,在语音处于纯语音情况下判断语音端点较准确,但在语音处于噪声情况下,尤其是低信噪比的情况下,端点识别率很低,出错率很高.基于提高此方法识别率的目的,采用调整阈值个数,平滑滤波,引入语音结束最小长度的方法对其进行改进,通过了Matlab仿真实验,得出了较好的语音端点检测准确率. 相似文献
17.
To counter face presentation attacks in face recognition (FR), color texture has been successfully used for face presentation attack detection (PAD) in recent years. However, the existing research does not fully consider the correlation between different color channels as well as the optimization of classification for face PAD. To resolve these limitations, a face PAD scheme based on chromatic co-occurrence of local binary pattern (CCoLBP) and ensemble learning (EL) is proposed in this paper. A color distortion-based face PAD model is first built, and then the chromatic discrepancies between bona fide faces and artefacts are analyzed. After that, CCoLBP is extracted as the feature to characterize these discrepancies. Meanwhile, an EL based classifier is put forward to reduce the effect of class imbalance and to improve the generalization ability. Experimental results and analysis indicate that the proposed scheme can achieve an overall good performance. Moreover, it can achieve significant improvement in the cross-database test, and its computational complexity can meet the requirement of real time applications. 相似文献
18.
针对传统能量熵的短时能量与子带谱熵容易受噪声环境影响,低信噪比下端点检测性能下降的问题,提出一种基于噪声估计的改进能量熵语音端点检测算法.首先对语音进行噪声估计并以此计算语音存在概率;然后利用估计的噪声能量修正短时能量,用语音存在概率作为加权系数优化子带谱熵,并将两者结合生成改进的能量熵;最后给出基于噪声估计的动态门限... 相似文献
19.
随着语音合成和语音转换技术的快速发展,欺骗语音检测方法仍存在欺骗检测准确率低、通用性差等问题。因此,提出一种基于上下文信息与注意力特征的端到端的欺骗检测方法。该方法基于深度残差收缩网络(DRSN),利用双分支上下文信息协调融合模块(DCCM)聚集丰富的上下文信息,融合基于协调时频注意力机制(CTFA)的特征以获得具有上下文信息的跨维度交互特征,从而最大化捕获伪影的潜力。与最佳基线系统相比,在ASVspoof 2019 LA数据集中,所提方法在EER和t-DCF性能指标上分别降低68%和65%;在ASVspoof 2021 LA数据集中,所提方法的EER和t-DCF分别为4.81和0.3115,分别降低48%和10%。实验结果表明,所提方法能有效提高欺骗语音检测的准确率和泛化能力。 相似文献