共查询到20条相似文献,搜索用时 140 毫秒
1.
2.
为了提高语音端点检测效果,将小波分析和神经网络相融合,提出一种基于小波神经网络的语音端点检测算法(WA-PCA-RBF)。利用小波分析提取语音信号的特征向量,采用主成分分析法选择语音信号特征,消除冗余特征,将选择特征向量作为RBF神经网络输入,通过遗传算法优化RBF神经网络参数建立语音端检测模型。结果表明,相对于传统语音端点检测算法,WA-PCA-RBF提高了语音端点检测正确率,具有更好的适应性和鲁棒性,可满足实际系统需求。 相似文献
3.
语音信号端点检测的实验研究 总被引:1,自引:0,他引:1
端点检测是语音识别中的一项关键技术,端点检测的准确性对语音识别的性能有很大影响,特别是对端点检测比较敏感的语音识别算法。本文通过实验证明采用LPCMFCC的带噪声端点检测改进方法在白噪声低信噪比下性能明显优于基于能量和常规倒谱距离的检测方法。它消除了噪声的影响,具有很好的鲁棒性,且具有较强的实际应用价值。 相似文献
4.
5.
端点检测是语音信号处理的一个关键环节。为提高语音在低性噪比以及非平稳噪声环境下的端点检测性能,在长时信号变化特征(LTSV)的基础上提出一种新的D-LTSV语音端点检测方法。采用Bartlett-Welch方法估计语音谱,分析语音谱在长时域上的熵,利用倒谱的动态特性分析方法提取连续帧熵值的动态变化特征。实验结果表明,D-LTSV综合考虑了语音的非平稳性和帧间非平稳性的动态变化情况,具有比LTSV更好的分辨能力,特别是在低性噪比和非平稳噪声的环境下,D-LTSV的分辨能力提升了50.77%,能够准确地进行端点检测,具有更强的鲁棒性。 相似文献
6.
7.
张梅 《计算机工程与应用》2012,48(16):133-135,167
为了提高语音端点检测的适应性和鲁棒性,提出一种基于小波分析和模糊神经网络的语音端点检测方法。利用小波变换得到语音信号的特征量,以这些特征量为模糊神经网络的输入进行运算,判断出该信号的类别。介绍了信号特征量的提取以及模糊神经网络的模型、学习算法等。实验表明,与传统的检测方法相比,所提出的方法有较好的适应性和鲁棒性,对不同信噪比的信号都有较好的检测能力。 相似文献
8.
《计算机应用与软件》2013,(5)
为了提高语音端点检测正确率,提出一种基于多特征和神经网络相结合的语音端点检测算法。首先分别提取语音信号的短时能量特征、时域方差特征和频域方差特征,然后将这些特征量作为神经网络输入进行训练和建模,最后判断出该信号的类别。仿真实验表明,相对于单一特征语音端点检测算法,多特征融合和神经网络检测算法提高了语音端点检测正确率,具有更好的适应性和鲁棒性,对不同信噪比的信号都有较好的检测能力。 相似文献
9.
10.
针对染有加性噪声的语音信号,提出了一种基于信号子空间和信息复杂度相结合的语音端点检测方法。该方法先利用信号子空间法去除加性噪声,再对增强后的语音利用信息复杂度进行端点检测。实验仿真表明,该方法相对传统的语音端点检测方法,能提高语音端点检测准确率,特别在低信噪比条件下具有较高的端点检测准确率。 相似文献
11.
针对过程工业中强噪声环境下实时采集的控制过程海量数据难以在线精确检测的问题,提出了基于阶数自学习自回归隐马尔可夫模型(ARHMM)的工业控制过程异常数据在线检测方法.该算法采用自同归(AR)模型对时间序列进行拟合,利用隐马尔科夫模型(HMM)作为数据检测的工具,避免了传统检测方法中需要预先设定检测阈值的问题,并将传统的... 相似文献
12.
针对Canny算法在处理噪声图像时存在的不足,为提高其准确性和鲁棒性,提出一种基于截断奇异值的低秩矩阵恢复方法,以及一种更加准确的双噪声凸优化模型和求解方法。使用经典Canny边缘检测算法作用于分解后去除冗余信息的主成分上,将图像的边缘检测转化为对主成分的边缘检测,可以在有效地去除脉冲噪声和高斯噪声干扰的同时,更好地保留边缘信息。为验证其有效性,在不同噪声浓度以及混合噪声情况下进行实验,结果分析表明,基于低秩矩阵恢复的边缘检测算法可以更好地保留完整的边缘信息,提高边缘检测的准确性及鲁棒性。 相似文献
13.
基于深度学习的人群密度检测算法取得了巨大进步,但该算法在实际复杂场景中的检测准确性和鲁棒性还有很大的提升空间.复杂场景下目标尺度不一致和背景信息干扰等因素使得人群密度检测成为一项具有挑战性的任务.针对该问题,提出了一种基于多尺度特征融合的人群密度检测网络.该网络首先利用不同分辨率图像并行交互提取人群粗细粒度特征,并引入多层次特征融合机制,以充分利用多层尺度信息.其次采用空间和通道注意力机制突出人群特征权重,聚焦感兴趣的人群,降低背景信息干扰,生成高质量密度图.实验结果表明,在多个典型的公共数据集上与具有代表性的人群密度检测方法相比,多尺度特征融合的人群密度检测网络具有良好的准确性和鲁棒性. 相似文献
14.
Sree Hari Krishnan Parthasarathi R. Padmanabhan Hema A. Murthy 《International Journal of Speech Technology》2011,14(4):361-368
This paper demonstrates the robustness of group delay based features to additive noise. First, we analytically show the robustness
of group delay based representations. The analysis makes use of the fact that, for minimum-phase signals, the group delay
function can be represented in terms of the cepstral coefficients of the log-magnitude spectrum. Such a representation results
in the speech spectrum dominating over the noise spectrum, both at low and high SNRs. Further, we experimentally demonstrate
the robustness of the representation on a voice activity detection (VAD) task, comparing a group delay based VAD algorithm
with standard VAD methods as well as a magnitude-spectrum based method. 相似文献
15.
16.
流量异常检测能够有效识别网络流量数据中的攻击行为,是一种重要的网络安全防护手段。近年来,深度学习在流量异常检测领域得到了广泛应用,现有的深度学习模型进行流量异常检测存在两个问题:一是数据受噪声影响导致检测鲁棒性差、准确率低;二是数据特征维度高以及模型参数多导致训练和检测速度慢。为了在降低流量数据噪声影响的基础上提高检测速度和准确性,本文提出了一种基于去噪自编码器(Denoising Auto Encoder,DAE)和门控循环单元(Gated Recurrent Unit,GRU)组合的流量异常检测方法。首先设计了基于DAE的流量特征提取算法,采用小批量梯度下降算法对DAE进行训练,通过最小化含噪声数据的重构向量与原始输入向量间的差异,有效提取具有较强鲁棒性的流量特征,降低特征维度。然后设计了基于GRU的异常检测算法,利用提取的低维流量特征数据训练GRU,从而构建异常流量分类器,实现对攻击流量的准确检测。最后在NSL-KDD、UNSW-NB15、CICIDS2017数据集上的实验结果表明:与其他的机器学习、深度学习方法相比,本文所提方法的检测准确率最大提升了18.71%。同时,本文方法可以实现较高的精确率、召回率和检测效率,同时具有较低的误报率。在面对数据受到噪声破坏时,具有较强的检测鲁棒性。 相似文献
17.
18.
基于像素级的遥感图像变化检测是利用配准后的不同时相遥感图像的原始像元灰度信息进行的变化检测,直观,易于理解,是目前应用较广泛的变化检测技术.由于现有算法无法在适应性、稳健性、准确性及时效性等方面实现性能全面占优,本文提出了一种基于D-S证据理论的融合变化检测方法,利用融合策略和规则在决策层对来自多种算法的检测结果进行综... 相似文献
19.
A Framework for Robust Watermarking of H.264-Encoded Video With Controllable Detection Performance 总被引:1,自引:0,他引:1
Maneli Noorkami Russell M. Mersereau 《Information Forensics and Security, IEEE Transactions on》2007,2(1):14-23
As H.264 digital video becomes more prevalent, the need for copyright protection and authentication methods that are appropriate for this standard will emerge. This paper proposes a robust watermarking algorithm for H.264. We employ a human visual model adapted for a 4 times 4 discrete cosine transform block to increase the payload and robustness while limiting visual distortion. A key-dependent algorithm is used to select a subset of the coefficients that have visual watermarking capacity. Furthermore, the watermark is spread over frequencies and within blocks to avoid error pooling. This increases the payload and robustness without noticeably changing the perceptual quality. We embed the watermark in the coded residuals to avoid decompressing the video; however, we detect the watermark from the decoded video sequence in order to make the algorithm robust to intraprediction mode changes. We build a theoretical framework for watermark detection based on a likelihood ratio test. This framework is used to obtain optimal video watermark detection with controllable detection performance. Our simulation results show that we achieve the desired detection performance in Monte Carlo trials. We demonstrate the robustness of our proposed algorithm to several different attacks 相似文献