排序方式: 共有36条查询结果,搜索用时 62 毫秒
11.
12.
提出了基于多元自适应回归样条法(Multivariate adaptive regression spline,MARS)的语音清晰度客观评价方法.该方法提取语音信号的Mel倒谱系数作为评估语音清晰度的候选特征参数.在Mel倒谱系数的失真距离基础上,利用MARS方法选出时语音清晰度影响较大的特征参数,并结合主观DRT分建立最佳客观预测模型,实现特征参数失真距离到客观DRT分的映射.仿真结果表明,分别采用训练集合样本和测试集合样本进行测试时,使用该方法评价的客观DRT分与主观DRT分的相关度.分别达到0.958和0.910 2. 相似文献
13.
目的 对抗样本是指在原始数据中添加细微干扰使深度模型输出错误结果的合成数据。视觉感知性和攻击成功率是评价对抗样本的两个关键指标。当前大多数对抗样本研究侧重于提升算法的攻击成功率,对视觉感知性的关注较少。为此,本文提出了一种低感知性对抗样本生成算法,构造的对抗样本在保证较高攻击成功率的情况下具有更低的视觉感知性。方法 提出在黑盒条件下通过约束对抗扰动的面积与空间分布以降低对抗样本视觉感知性的方法。利用卷积网络提取图像中对输出结果影响较大的关键区域作为约束,限定扰动的位置。之后结合带有自注意力机制的生成对抗网络在关键区域添加扰动,最终生成具有低感知性的对抗样本。结果 在3种公开分类数据集上与多种典型攻击方法进行比较,包括7种白盒算法FGSM (fast gradient sign method)、BIM (basic iterative method)、DeepFool、PerC-C&W (perceptual color distance C&W)、JSMA (Jacobian-based saliency map attacks)、APGD (auto projected gradient descent)、AutoAttack和2种黑盒算法OnePixel、AdvGAN (adversarial generative adversarial network)。在攻击成功率(attack success rate,ASR)上,本文算法与对比算法处于同一水平。在客观视觉感知性对比中,本文算法较AdvGAN在低分辨率数据集上,均方误差(mean square error,MSE)值降低了42.1%,结构相似性值(structural similarity,SSIM)提升了8.4%;在中高分辨率数据集上,MSE值降低了72.7%,SSIM值提升了12.8%。与视觉感知性最好的对比算法DeepFool相比,在低分辨率数据集上,本文算法的MSE值降低了29.3%,SSIM值提升了0.8%。结论 本文分析了当前算法在视觉感知性上存在的问题,提出了一种对抗样本生成方法,在攻击成功率近似的情况下显著降低了对抗样本的视觉感知性。 相似文献
14.
针对视频序列中目标的跟踪问题,提出了一种基于粒子滤波框架的联合仿射和外貌模型的目标跟踪算法.该算法首先提取图像帧之间的相关特征点,通过求解Sylvester方程得到仿射参数,然后将仿射参数嵌入到基于仿射群的粒子滤波框架中进行平滑估计.利用基于仿射群的一阶自回归过程模拟状态的变化,联合仿射特征点模型和外貌模型进行似然估计,得到粒子的最佳平均状态,进而对目标实施跟踪.实验结果表明,在目标经历姿势和尺度变化、遮挡以及复杂背景等情况下,提出的算法能够有效地跟踪目标,较之其他相关算法具有很强的鲁棒性. 相似文献
15.
16.
本文在介绍指纹特征提取的基础上,分析了灰度指纹图像脊检测的特点,提出了一种利用数学形态中的扁平结构元素检测灰度指纹图像中脊的方法,并对这种方法的性能进行了分析,与传统算法相比,在达到同等检测效果的情况下,其运算效率提高了约40%。 相似文献
17.
针对视频目标鲁棒跟踪问题,提出了一种基于稀疏表示的生成式算法。首先提取特征构建目标和背景模板,并利用随机抽样获得足够多的候选目标状态;然后利用多任务反向稀疏表示算法得到稀疏系数矢量构造相似度测量图,这里引入了增广拉格朗日乘子(ALM)算法解决L1-min难题;最后从相似度图中使用加性池运算提取判别信息选择与目标模板相似度最高并与背景模板相似度最小的候选目标状态作为跟踪结果,该算法是在贝叶斯滤波框架下实现的。为了适应跟踪过程中目标外观由于光照变化、遮挡、复杂背景以及运动模糊等场景引起的变化,制定了简单却有效的更新机制,对目标和背景模板进行更新。对仿真结果的定性和定量评估均表明与其他跟踪算法相比,所提算法的跟踪准确性和稳定性有了一定的提高,能有效地解决光照和尺度变化、遮挡、复杂背景等场景的跟踪难题。 相似文献
18.
卷积神经网络分类框架广泛使用了基于Softmax函数的交叉熵损失(Softmax损失函数),在很多领域中都取得了良好的性能.但是由于Softmax损失函数并不鼓励增大类内紧凑性和类间分离性,在一些多分类问题中,卷积神经网络学习到的判别性嵌入表示的性能难以进一步提高.为了增强嵌入表示的判别性,提出 了一种基于余弦相似性的... 相似文献
19.
20.
语音交互技术在实际的话音驱动应用中得到日益普及。然而,当声源距离传声器较远时,由于实际环境中混响现象的影响,语音交互的性能还远不能使人满意。针对混响问题,数十年来学者们不断地进行大量的研究,并提出了很多实用的方法。特别是近期兴起的在很大程度上改变语音处理格局的深度学习技术,在单通道去混响方面也取得了很多令人瞩目的效果。然而,目前系统性总结分析基于深度学习的去混响方法与经典算法之间联系的工作仍然比较匮乏。因此,本文对单通道语音去混响技术的发展脉络进行系统的梳理和总结,并讨论了有待进一步研究的开放问题。 相似文献