首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 62 毫秒
1.
水声目标识别是被动声呐系统的主要应用之一。为了进一步提升小样本条件下水下目标的识别率,文章提出一种基于多尺度卷积和双端注意力机制相融合的方法。首先,提取梅尔倒谱系数,色度谱和计算谱对比度等特征,建立基于多类别特征子集的三维聚合特征。其次,采用多尺度卷积滤波器算子构造多分辨率卷积神经网络,以更好地适应三维聚合特征的时频结构。另外,采用双端注意力模型捕获样本的全局依赖和局部特性。采用基于指数加权的对数交叉熵函数作为损失函数,提升样本数较少类别的识别率。实验结果表明,该方法在ShipsEar数据上的平均识别率为95.5%,取得了较好的分类效果。  相似文献   

2.
针对滚动轴承故障诊断模型易受轴承工作环境噪声以及运行数据样本数量影响的特点,提出一种并行大核注意力机制卷积神经网络(PLKACNN)。首先,将一维时间序列通过短时傅里叶变换转化成二维图像作为模型的输入,使用并行大核注意力机制实现对不同维度的故障特征的提取;其次,将并行支路所得的特征图进行堆叠以获得整体信息,最终通过整合卷积层以及全连接层对整体信息进行学习以及分类。结果表明PLKACNN能够有效识别滚动轴承故障程度和故障位置,在带噪数据集上获得平均98.5%的准确率,并且在带噪小样本实验中获得92.81%平均准确率,证明所提PLKACNN具有较好的噪声鲁棒性以及泛化能力。  相似文献   

3.
傅里叶变换全息加密数字水印解密实验研究   总被引:3,自引:3,他引:0  
在理论分析傅里叶变换加密全息水印技术的基础上,通过MATLAB软件对加密全息水印的生成和提取进行了模拟仿真,验证了加密全息水印技术的安全性。通过搭建的光学解密再现系统,对经过计算机滤波处理后的含水印载体图像进行了光学解密再现,结果表明,无需原始载体图像的参与,通过正确的密匙就可以提取出原始水印图像,验证了加密全息水印技术的抗攻击性。对不同嵌入强度、位压缩、剪切、嵌入白噪声的载体图像进行了解密实验,计算其PSNR,得到了PSNR>20,即加密全息水印具有较强的抗低通滤波、噪声、剪切性能,具有较强的鲁棒性。傅里叶变换加密全息水印解密光学系统相对于计算机仿真系统,具有高并行性、高处理速度、高信息维度、便捷性等优点,可用于进行版权保护。  相似文献   

4.
针对传统x-vector模型生成方言语音段级表示时,未考虑不同帧级特征对方言辨识作用不一致的问题,以及维吾尔语的黏着性特点,提出结合注意力机制和因果卷积网络的维吾尔语方言识别方法。首先使用多层因果卷网络实现方言语音序列建模,然后采用空洞卷积核增大感受野扩展采样范围,最后使用注意力池化获取方言语音段级特征。维吾尔语方言识别实验结果表明,所提方法较标准x-vector模型方言识别的识别准确率提升了23.19个百分点。  相似文献   

5.
基于傅里叶变换域全息数字水印算法研究   总被引:4,自引:4,他引:0  
汪微  唐波  王夫清  李孟涛 《包装工程》2013,34(19):101-104,122
通过模拟傅里叶变换加密全息水印的生成对水印信息进行了预处理,并通过模拟加密全息水印的重建水印算法对水印信息进行了重建,保证了水印的安全性。在DCT 和DWT 相结合的变换域中,嵌入水印及在均匀颜色空间CIELab 的亮度分量L 中嵌入水印,使水印的不可见性较好,该算法利用全息加密对裁切攻击有较好的鲁棒性,且属于盲提取水印技术。实验结果表明,嵌入水印的图像能够满足人眼视觉的要求,同时也满足客观评价标准,而且重建的水印图像较清晰,能够精确判断图像的真伪。  相似文献   

6.
孙刘杰  刘倩倩  庞茂然 《包装工程》2023,44(21):286-293
目的 解决大面积破损难以修复且修复过程中感受野、特征空间信息利用不足,导致修复后的孔洞区域与背景之间出现结构、纹理、风格不一致的问题。方法 基于傅里叶卷积和多特征调制的修复网络FFC-MFMGAN,傅里叶卷积在网络的浅层便具有较大的感受野,尤其是在宽掩码时能够跳过掩码区域,捕获到有效特征,多特征调制生成网络能够分别利用完整区域的信息和随机样式操纵,增强与未受损区域的语义连贯性,以及大空洞率下修复的多样性。结果 在Place 2数据集上,将文中方法与其他图像修复方法进行了对比实验,经过测试,各类指标均得到明显改善,峰值信噪比提高了1.4%,结构相似性提高了4.5%,平均绝对误差降低了12.6%,基于学习的感知图像块相似性降低了9.1%。结论 FFC-MFMGAN网络能够较好地修复大面积不规则孔洞,同时增强修复图像的全局结构性和清晰度,对实际包装印刷图像的缺陷修复也有一定参考价值。  相似文献   

7.
徐胜军  杨华  李明海  刘光辉  孟月波  韩九强 《光电工程》2023,50(12):230225-1-230225-17

针对低照度图像质量较差、噪声多、纹理模糊等问题,提出一种基于双频域特征聚合的低照度增强网络(dual frequency-domain feature aggregation network, DF-DFANet)。首先,构建频谱光照估计模块(frequency domain illumination estimation module, FDIEM)实现跨域特征提取,通过共轭对称约束调整频域特征图抑制噪声信号,并采用逐层融合方式提高多尺度融合效率以扩大特征图感受野范围。其次,设计多谱双注意力模块(multiple spectral attention module, MSAM)聚焦图像局部频率特征,通过小波域空间、通道注意力机制关注图像细节信息。最后,提出双域特征聚合模块(dual domain feature aggregation module, DDFAM)融合傅里叶域和小波域特征信息,利用激活函数计算自适应调整权重实现像素级图像增强,并结合傅里叶域全局信息提高融合效果。实验结果表明,在LOL数据集上所提网络的PSNR达到24.3714,SSIM达到0.8937。与对比网络相比,所提网络增强效果更具自然性。

  相似文献   

8.
针对隧道风机预埋基础损伤信息微弱、特征难以提取等问题,提出一种基于度量-频段注意力卷积神经网络的隧道风机预埋基础损伤识别方法。首先,通过预埋基础冲激试验的激励信号和响应信号,计算预埋基础的频率响应函数并作为损伤识别模型的输入;然后,使用多层卷积将输入的频率响应函数映射到特征空间提取损伤特征信息;再次,采用频段注意力机制对不同频段上的特征进行自适应加权融合,并采用度量损失进一步增强提取特征的可辨识性;最后,将提取的特征输入全连接层以实现预埋基础损伤识别。实测数据验证结果表明,所提方法对比现有的神经网络模型具有更高识别率,能够对隧道风机预埋基础健康状态进行有效地评估。  相似文献   

9.
赵欣  黎红豆  王洪凯 《声学技术》2024,43(5):668-676
针对目前超声影像下甲状腺结节分割不够精准的问题,提出一种融合多尺度特征和注意力机制的超声甲状腺结节分割方法。该模型编码设计了多感受野通道选择模块,通过核心选择注意力对多个不同感受野的特征进行自适应加权组合,使包含目标的感受野通道占据主导。同时,设计自适应全局上下文模块自适应地提取瓶颈层多个尺度的全局上下文特征,以实现对瓶颈层高级语义的有效编码。此外,设计双注意力引导模块增强编解码器对等层之间的特征融合,以减少上采样过程中的信息损失。在公开的超声甲状腺结节数据集上进行实验,结果表明,文中所提方法优于其他对比网络,能更加精准地分割出甲状腺结节,有效提升了甲状腺结节的分割性能。  相似文献   

10.
11.
张艳  马春明  刘树东  孙叶美 《光电工程》2024,51(12):240237-1-240237-15

针对现有基于Transformer的语义分割网络存在的多尺度语义信息利用不充分、处理图像时生成冗长序列导致的高计算成本等问题,本文提出了一种基于多尺度特征增强的高效语义分割主干网络MFE-Former。该网络主要包括多尺度池化自注意力模块(multi-scale pooling self-attention, MPSA)和跨空间前馈网络模块(cross-spatial feed-forward network, CS-FFN)。其中,MPSA利用多尺度池化操作对特征图序列进行降采样,在减少计算成本的同时还高效地从特征图序列中提取多尺度的上下文信息,增强Transformer对多尺度信息的建模能力;CS-FFN通过采用简化的深度卷积层替代传统的全连接层,减少前馈网络初始线性变换层的参数量,并在前馈网络中引入跨空间注意力(cross-spatial attention, CSA),使模型更有效地捕捉不同空间的交互信息,进一步增强模型的表达能力。MFE-Former在数据集ADE20K、Cityscapes和COCO-Stuff上的平均交并比分别达到44.1%、80.6%和38.0%,与主流分割算法相比,MFE-Former能够以更低的计算成本获得具有竞争力的分割精度,有效改善了现有方法多尺度信息利用不足和计算成本高的问题。

  相似文献   

12.
    
With the social and economic development and the improvement of people's living standards, smart medical care is booming, and medical image processing is becoming more and more popular in research, of which brain tumor segmentation is an important branch of medical image processing. However, the manual segmentation method of brain tumors requires a lot of time and effort from the doctor and has a great impact on the treatment of patients. In order to solve this problem, we propose a DO-UNet model for magnetic resonance imaging brain tumor image segmentation based on attention mechanism and multi-scale feature fusion to realize fully automatic segmentation of brain tumors. Firstly, we replace the convolution blocks in the original U-Net model with the residual modules to prevent the gradient disappearing. Secondly, the multi-scale feature fusion is added to the skip connection of U-Net to fuse the low-level features and high-level features more effectively. In addition, in the decoding stage, we add an attention mechanism to increase the weight of effective information and avoid information redundancy. Finally, we replace the traditional convolution in the model with DO-Conv to speed up the network training and improve the segmentation accuracy. In order to evaluate the model, we used the BraTS2018, BraTS2019, and BraTS2020 datasets to train the improved model and validate it online, respectively. Experimental results show that the DO-UNet model can effectively improve the accuracy of brain tumor segmentation and has good segmentation performance.  相似文献   

13.
    
In social networks, user attention affects the user’s decision-making, resulting in a performance alteration of the recommendation systems. Existing systems make recommendations mainly according to users’ preferences with a particular focus on items. However, the significance of users’ attention and the difference in the influence of different users and items are often ignored. Thus, this paper proposes an attention-based multi-layer friend recommendation model to mitigate information overload in social networks. We first constructed the basic user and item matrix via convolutional neural networks (CNN). Then, we obtained user preferences by using the relationships between users and items, which were later inputted into our model to learn the preferences between friends. The error performance of the proposed method was compared with the traditional solutions based on collaborative filtering. A comprehensive performance evaluation was also conducted using large-scale real-world datasets collected from three popular location-based social networks. The experimental results revealed that our proposal outperforms the traditional methods in terms of recommendation performance.  相似文献   

14.
传统的语音情感识别方式采用的语音特征具有数据量大且无关特征多的特点,因此选择出与情感相关的语音特征具有重要意义。通过提出将注意力机制结合长短时记忆网络(Long Short Term Memory, LSTM),根据注意力权重进行特征选择,在两个数据集上进行了实验。结果发现:(1)基于注意力机制的LSTM相比于单独的LSTM模型,识别率提高了5.4%,可见此算法有效提高了模型的识别效果;(2)注意力机制是一种有效的特征选择方法。采用注意力机制选择出了具有实际物理意义的声学特征子集,此特征集相比于原有公用特征集在降低了维数的情况下,提高了识别准确率;(3)根据选择结果对声学特征进行分析,发现有声片段长度特征、无声片段长度特征、梅尔倒谱系数(Mel-Frequency Cepstral Coefficient, MFCC)、F0基频等特征与情感识别具有较大相关性。  相似文献   

15.
         下载免费PDF全文
Aiming at the harsh environment and serious light pollution in the production workshop of automobile body-in-white, it is difficult to accurately locate and inefficient when the vision system and other equipment are combined to detect the quality of the solder joints. An improved U-Net image segmentation algorithm was proposed. By improving the convolution structure to better fuse the semantic information of the feature map and lighten the network structure. Improve the loss function and integrate the attention mechanism to better mine the foreground in the case of uneven positive and negative samples, obtain spatial features of different scale feature maps and establish long-term channel relationships. Compared with the original U-Net network, the Dice coefficient of the proposed RPSA-U-Net network is increased by 8.76% to 0.983 6, the MIOU is increased by 11.5% to 0.967 81, and the network parameters are also reduced by 7%. Combined with the image processing method to find the center of the solder joint, the efficiency is higher and the precision is higher, and it has application value.  相似文献   

16.
介绍基于快速傅立叶变换FFT、褶积镶边理论以及线性相位理论所开发出的FIR数字滤波系统及工作原理。成功开发出的FIR数字滤波系统在数字信号处理的专业应用上,对连续信号能高效地进行数字高通、数字低通、数字带通及数字带阻四种功能的滤波处理,系统设计所采用的优化分析和处理方法使其幅相频特性比较理想,从而保证输出信号在较高的精度上没有幅值和相位失真;在控制方式上具有比硬件控制及软硬结合控制较大的优越性:变参数输入的灵活性、分析结果系统内输出的多样性、面向对象应用软件使用上的友好性、可移植性、再开发性、可维护性、开发周期的高效性和费用的便宜性等。分析结果表用,FIR数字滤波系统用于实际的滤波处理是稳定并且可靠的。  相似文献   

17.
郭进元  马永强 《包装工程》2017,38(3):155-159
目的提高彩色图像数字水印的抗攻击性能,包括缩放、旋转、平移、噪声攻击等。方法基于坐标变换和四元数傅里叶变换提出一种彩色图像数字水印算法。介绍彩色图像四元数表示形式及其双侧傅里叶变换,并分析笛卡尔坐标和极对数坐标之间的变换关系。选择四元数傅里叶变换后实部的中低频部分作为嵌入区域;为提高算法的抗几何攻击能力,给出笛卡尔坐标系和对数极坐标系之间对应点的位置关系;详细论述水印嵌入和提取的流程。结果针对噪声、滤波、剪切等攻击进行了实验研究,结果表明所述算法可以提高提取信息的准确率和水印的抗攻击能力。结论该算法在保证水印隐蔽性的同时能够抵抗一定程度的攻击,满足版权保护和数字防伪的需要。  相似文献   

18.
目的 针对目前智能垃圾分类设备使用的垃圾检测方法存在检测速度慢且模型权重文件较大等问题,提出一种基于YOLOv4的轻量化方法,以实现可回收垃圾的检测。方法 采用MobileNetV2轻量级网络为YOLOv4的主干网络,用深度可分离卷积来优化颈部和头部网络,以减少参数量和计算量,提高检测速度;在颈部网络中融入CBAM注意力模块,提高模型对目标特征信息的敏感度;使用K-means算法重新聚类,得到适合自建可回收数据集中检测目标的先验框。结果 实验结果表明,改进后模型的参数量减少为原始YOLOv4模型的17.0%,检测的平均精度达到96.78%,模型权重文件的大小为46.6 MB,约为YOLOv4模型权重文件的19.1%,检测速度为20.46帧/s,提高了约25.4%,检测精度和检测速度均满足实时检测要求。结论 改进的YOLOv4模型能够在检测可回收垃圾时保证较高的检测精度,同时具有较好的实时性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号