首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 46 毫秒
1.
针对在低信噪比环境下传统语音增强方法适应性差和增强效果不理想的问题,提出一种基于Wasserstein散度的深度生成对抗网络(Wasserstein Divergence Deep Generative Adversarial Network)的语音增强方法。该方法以5个生成器和1个判别器为基础组成深度生成对抗网络,利用5个生成器进行5次增强处理,有效提高对抗网络在低信噪比条件下的增强效果,使用Wasserstein散度优化网络训练,改善传统GAN网络训练过程中存在的训练不稳定等问题,提高深度生成对抗网络训练的稳定性。在低信噪比环境下该方法相比于传统语音增强方法噪声适应性和增强效果都有明显提升。实验结果表明,与原始带噪语音相比,增强语音的分段信噪比平均提高6.1dB,语音质量感知评估测度和短时客观可懂度分别平均提升28.9%和10.6%。  相似文献   

2.
为了更精确地从语谱图中提取特征信息,提出了一种基于A-DResUnet的语音增强方法。A-DResUnet模型在ResUnet模型的基础上融合了空洞卷积,提升捕获语音上下文信息的能力;同时在编码器中加入卷积注意力模块(CBAM),提高对噪声谱图特征的关注。实验结果表明,与模型输出目标为干净语音语谱图相比,用噪声谱图作为模型输出目标时,该模型对未知噪声具有更强的分离能力;相较ResUnet模型,提出的A-DResUnet模型减少了语音细节信息的损失;对比基于DNN、GAN的语音增强方法,PESQ平均提升了22.81%、33.11%,STOI平均提升了9.62%、15.33%,为复杂环境下的语音增强提供了一种更有效的方法。  相似文献   

3.
针对复杂环境中动作识别易受到光照变化、目标旋转,遮挡等导致目标位置不精确,目标漂移以及识别错误等问题,提出了一种基于双特征融合与自适应提升的动作识别算法。首先,基于时空上下文(spatio-temporal context,STC)机制,通过时空上下文关系与视觉系统特性来提取图像序列特征,降低光照变化、遮挡对行为动作的影响;同时,利用卷积神经网络(convolution neural network,CNN)来处理图像序列,分别获得STC特征与CNN特征;其次,引入主成分分析算子,定义双特征融合规则,对获得STC特征与CNN特征进行组合,形成一种更准确、完整的特征表示;然后,通过得到的新特征,利用自适应提升算法(adaptive boosting algorithm,ABA)进行分类训练,完成对行为动作决策判断。在Weizmann、Hollywood数据集上测试表明,相对于当前常用的动作识别方法,所提算法对各种行为动作具有更高的识别精度与鲁棒性,更能适应复杂背景和动作变化。所提算法具有较高的人体动作识别精度,在视频监测、人机交互等领域具有一定的应用价值。  相似文献   

4.
针对目标跟踪中部分遮挡及漂移问题,提出了一种基于多特征自适应融合和在线学习的目标跟踪算法。首先针对原始特征提取的相对简易性,提出了改进的特征提取方法,提高了特征的表达能力和判别能力,然后将多种特征自适应融合,最后进行在线学习。实验采用了具有挑战性的公共测试数据集PETS 2012,并用MOTP评测了跟踪性能。实验结果验证了提出算法的有效性,大大提高了复杂场景下的跟踪鲁棒性,有效地解决了部分遮挡和跟踪漂移问题。  相似文献   

5.
分布式电源在接入电网时会产生复杂的电能质量扰动(power quality disturbances,PQDs),为提高对PQDs信号分类识别的准确率,构建了自适应特征增强分组卷积神经网络(grouping convolutional neural network with adaptive feature enhanced network,GCNN-AFEN)。GCNN-AFEN模型的核心:首先,对PQDs信号进行S变换形成时频矩阵图像,利用CNN与结构稀疏的GCNN相结合作为特征学习的基础框架以减少模型参数,进而提高运算速度;然后,AEFN模块通过通道注意力机制、频域特征增强和软阈值去噪环节,自适应学习扰动类型与对应特征图的相关性,增加信噪比,突出能够代表扰动类别的深层特征;最后,通过全连接层(fully connected layers,FC)和Softmax分类器进行分类识别。仿真实验表明,提出的模型对于电能质量扰动信号具有较高的分类识别准确率和噪声鲁棒性,能够用于电能质量扰动的快速识别和分类。  相似文献   

6.
本文提出新的语音增强方法。这种新方法先将带噪信号进行离散余弦变换,得到带噪语音信号的DCT系数,并提取这些DCT系数的参数作为神经网络的输入来估计阈值,从而构造阈值函数对变换后的系数进行处理,再进行离散余弦反变换最终达到去噪的目的。本文实验中的噪声采用加性高斯白噪声,仿真实验结果表明新方法具有良好的语音增强效果,特别是在低信噪比情况下,效果更好。  相似文献   

7.
随着电网设备运维的智能化发展,文本作为复杂的非结构化数据如何被有效利用已成为重要的问题。首先利用新词发现和传统分词方法对文本预处理,然后将字词特征映射至多维向量空间,最后基于特征融合构建了注意力机制优化卷积神经网络缺陷文本分类模型。算例分析表明,所提方法比传统深度学习方法提高了分类准确率,有更好的语义学习能力。  相似文献   

8.
针对目前车辆跟踪研究算法中,核相关滤波算法(KCF)在复杂背景下存在特征提取单一以及尺度无法自适应的不足,本文提出一种多特征融合的尺度自适应算法。该算法以颜色直方图信息作为颜色特征,将具有更多语义信息的高层卷积特征和拥有较高分辨率的底层卷积特征作为深度特征,并与颜色特征进行自适应特征融合。然后,采用上下文图像对目标背景信息进行约束优化,并通过平均峰值相关能量检测衡量响应置信度,最后利用高置信度的跟踪结果来避免模型易受干扰的问题。通过在OTB100数据集上的实验表明,本文算法的精度分别比其他的主流跟踪算法Staple、SAMF、KCF、TLD、DSST和CSK高出4.9%, 5.7%, 10.2%, 10.3%, 23.4%, 29.7%。  相似文献   

9.
针对点云在噪声、遮挡及相似特征多个干扰条件下容易产生错误配准的问题,提出一种基于多特征的关键点提取算法和自适应尺度的融合特征的点云配准方法。在关键点提取时,同时计算多个特征,使关键点更具描述性和鲁棒性。特征描述时,在自适应尺度的基础上使用FPFH和RoPs特征两种特征分别进行初始配准和错误点对剔除,最终各自得到多个相似的转换矩阵。完成上述求解后,将两者得到的矩阵组成集合进行聚类并对矩阵数最多的类取平均值处理作为最终的结果以完成特征的融合。实验研究表明,在忽略极少数无法具体化的错误配准点的情况下,真实场景下所提算法的RMSE、ATI和ERR分别为0.46 mm, 1和0.37;使用数据集测试得到的正确率为99.3%,均表明该算法的精度和鲁棒性较高。  相似文献   

10.
提出了一种自适应多特征融合算法,通过多轮迭代自适应地获得对应不同特征支持向量机(SVM)的权值矩阵,并使用该权值矩阵将不同特征SVM的故障类型预测值进行融合,从而提高变压器绕组故障类型识别准确率.  相似文献   

11.
基于直线和SIFT融合特征的物体识别研究   总被引:2,自引:0,他引:2  
本文阐述了基于直线特征和SIFT(scale invariant feature transform)特征融合的物体识别研究,直线特征是最普遍的图像特征之一,而SIFT特征是最鲁棒的局部特征,其对旋转、尺度缩放、亮度变化保持不变性。本文以家用遥控器作为目标物体,首先提取平行直线特征作为本问中的主要图像特征,通过与物体模型进行匹配可以产生出很多的假设匹配结果,SIFT特征作为辅助特征,用来降低匹配的不确定性,从而提高识别率。试验结果表明该方法在复杂的环境中达到了鲁棒的识别效果。  相似文献   

12.
Speech recognition is a hot topic in the field of artificial intelligence. Generally, speech recognition models can only run on large servers or dedicated chips. This paper presents a keyword speech recognition system based on a neural network and a conventional STM32 chip. To address the limited Flash and ROM resources on the STM32 MCU chip, the deployment of the speech recognition model is optimized to meet the requirements of keyword recognition. Firstly, the audio information obtained through sensors is subjected to MFCC (Mel Fre-quency Cepstral Coefficient) feature extraction, and the extracted MFCC features are input into a CNN (Convolutional Neural Network) for deep feature extraction. Then, the features are input into a fully connected layer, and finally, the speech keyword is classified and predicted. Deploying the model to the STM32F429, the prediction model achieves an accuracy of 90.58%, a decrease of less than 1% compared to the accuracy of 91.49% running on a computer, with good performance.  相似文献   

13.
特征金字塔网络(feature pyramid network,FPN)已经成为目标检测中提取多尺度特征的有效框架。然而,FPN存在着由于通道减少导致语义信息丢失、高层特征只包含单尺度的上下文信息和具有语义差别的不同层特征直接融合造成混叠效应等问题。针对上述问题,本文提出了基于注意力增强指导的特征金字塔网络。该模型由通道特征增强模块、上下文增强模块和注意力指导特征融合模块三个部分组成。具体来说,通道特征增强模块通过建模特征之间的依赖关系减轻由于通道减少造成的信息损失,上下文增强模块利用不同级别特征进行上下文信息提取以增强高层特征,注意力指导特征融合模块利用注意力机制指导相邻层特征学习来增进彼此语义信息的一致性。将Faster R-CNN和Mask R-CNN目标检测器中的FPN替换为本文模型并在不同的数据集上进行实验,实验结果表明,改进后的Faster R-CNN检测器在PASCAL VOC和MS COCO数据集上的平均精度分别提高1.5%和1%,改进后的Mask R-CNN检测器在MS COCO数据集上也分别将Mask AP和Box AP的性能提升了0.8%和1.1%。  相似文献   

14.
This paper presents the application of a Complex Adaptive Linear Neural Network (CADALINE) in tracking the fundamental power system frequency. In this method, by using stationary-axes Park transformation in addition to producing a complex input measurement, the decaying DC offset is eliminated. As the proposed method uses first-order differentiator to estimate frequency changes, a Hamming filter is used to smoothen the response and cancel high-frequency noises. The most distinguishing features of the proposed method are the reduction in the size of observation state vector required by a simple Adaptive Linear Neural Network (ADALINE) and increase in the accuracy and convergence speed under transient conditions. This paper concludes with the presentation of the representative results obtained in numerical simulation and simulation in PSCAD/EMTDC software as well as in practical study.  相似文献   

15.
液晶屏电子仪表因其示数精确,抗干扰能力强的特性,逐渐取代了指针式仪表,在工业生产中得到了广泛的应用。针对液晶屏的自身的显示特性和显示原理,提出一种利用信息熵进行自适应彩色形态学预处理且基于HSV空间和色调映射V通道增强液晶屏区域分割方法,并结合了双通道图像加权融合的区域图像增强算法研究,实现液晶屏位置区域的分割。对多种液晶屏图像的分割实验的结果表明,较之传统液晶屏分割方案,该方法对单色液晶屏的分割准确度提升8.6%,对彩色液晶屏分割准确度提升了12.4%。  相似文献   

16.
According to recent research statistics, approximately 30% of people who experienced falls are over the age of 65. Therefore, it is meaningful research to detect it in time and take appropriate measures when falling behavior occurs. In this paper, a fall detection model based on improved human posture estimation algorithm is proposed. The improved human posture estimation algorithm is implemented on the basis of Openpose. An improved strategy based on depthwise separable convolution combined with HDC structure is proposed. The depthwise separable convolution is used to replace the convolution neural network structure, which makes the network lightweight and reduces the re-dundant layer in the network. At the same time, in order to ensure that the image features are not lost and ensure the accuracy of detecting human joint points, HDC structure is introduced. Experiments show that the improved algorithm with HDC structure has higher accuracy in joint point detection. Then, human posture estimation is applied to fall detection research, and fall event modeling is carried out through fall feature extraction. The designed convolution neural network model is used to classify and distinguish falls. The experimental results show that our method achieves 98.53%, 97.71% and 97.20% accuracy on three public fall detection data sets. Compared with the experimental results of other methods on the same data set, the model designed in this paper has a certain improvement in system accuracy. The sensitivity is also improved, which will reduce the error detection probability of the system. In addition, this paper also verifies the real-time performance of the model. Even if researchers are experimenting with low-level hardware, it can ensure a certain detection speed without too much delay.  相似文献   

17.
由于城市监控中存在大量相似的车辆,造成了车辆重识别匹配率低。车头、车窗、车顶等局部特征是相似车辆细微差异性的所在。根据车辆检测算法卷积特征热力图注意力分布特性,提出了针对车辆局部特征区域检测的MCRF-SSD算法,并与GMM-EM聚类算法相结合,检测性能在公开的数据集上均优于目前主流算法。同时为了增大类间距离、缩小类内距离将arcface损失函数引入到了特征提取阶段。为了提高车辆重识别匹配性能,在全局特征与局部特征融合阶段提出了一种保留特征图空间分布的焦点融合(Ffs)方法,并引入了一个可学习参数,提高了特征融合效率。实验结果表明,所提出的算法在公开的VehicleID和VeRi数据集中性能表现优于目前性能最优的方案。  相似文献   

18.
基于自适应软阈值和边缘增强的图像去噪   总被引:3,自引:0,他引:3  
目前图像的去噪和边缘细节的保留是图像去噪中存在的2个大问题,该文提出使用边缘检测的方法检测出图像的边缘和纹理细节,对检测出的边缘和纹理细节图像进行处理后,将它和含噪图像分别进行小波变换,然后将其小波系数对应叠加,最后对叠加之后的小波系数进行小波自适应软阈值去噪。由于在软阈值去噪前叠加了边缘信息,因此边缘和细节部分得到了增强,虽然在阈值处理过程中由于边缘和细节均处于高频部分,在随后的软阈值去噪过程中存在被平滑的危险,但是增强后边缘和纹理的小波系数的幅值被放大,在阈值处理时可以得以保留。实验证明该方法比较wiener滤波在视觉效果和信噪比方面都有较大的改善,同时该方法比传统软阈值滤波,在视觉效果相差不大的情况下信噪比也有1~2个dB的提高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号