排序方式: 共有72条查询结果,搜索用时 46 毫秒
11.
为了提升深度卷积神经网络对音乐频谱流派特征的提取效果,提出一种基于频谱空间域特征注意的音乐流派分类算法模型DCNN-SSA。DCNN-SSA模型通过对不同音乐梅尔谱图的流派特征在空间域上进行有效标注,并且改变网络结构,从而在提升特征提取效果的同时确保模型的有效性,进而提升音乐流派分类的准确率。首先,将原始音频信号进行梅尔滤波,以模拟人耳的滤波操作对音乐的音强及节奏变化进行有效过滤,所生成的梅尔谱图进行切割后输入网络;然后,通过深化网络层数、改变卷积结构及增加空间注意力机制对模型在流派特征提取上进行增强;最后,通过在数据集上进行多批次的训练与验证来有效提取并学习音乐流派特征,从而得到可以对音乐流派进行有效分类的模型。在GTZAN数据集上的实验结果表明,基于空间注意的音乐流派分类算法与其他深度学习模型相比,在音乐流派分类准确率和模型收敛效果上有所提高,准确率提升了5.36个百分点~10.44个百分点。 相似文献
12.
为了解决现有遥感图像超分辨率重建模型对长期特征相似性和多尺度特征相关性关注不足的问题, 提出了一种基于跨尺度混合注意力机制的遥感图像超分辨率重建算法. 首先提出了一个全局层注意力机制(global layer attention, GLA), 利用层注意力机制加权融合不同层级的全局特征, 建模低分辨率与高分辨率图像特征间的长期依赖关系. 同时, 设计了跨尺度局部注意力机制(cross-scale local attention, CSLA), 在多尺度的低分辨率特征图中寻找与高分辨率图像匹配的局部信息补丁, 并融合不同尺度的补丁特征, 以优化模型对图像细节信息的恢复能力. 最后, 提出一种局部信息感知损失函数来指导图像的重建过程, 进一步提高了重建图像的视觉质量和细节保留能力. 在UC-Merced数据集上的实验结果表明, 本文方法在3种放大倍数下的平均PSNR/SSIM优于大多数主流方法, 并在视觉效果方面展现出更高的质量和更好的细节保留能力. 相似文献
13.
目的 针对合成孔径雷达(synthetic aperture radar, SAR)图像噪声大、成像特征不明显,尤其在复杂场景更容易出现目标误检和漏检的问题,提出了一种融合多重机制的SAR舰船检测方法,用于提高SAR舰船检测的精度。方法 在预处理部分,设计了U-Net Denoising模块,通过调整噪声方差参数L的范围来抑制相干斑噪声对图像的干扰。在YOLOv7(you only look once v7)主干网络构建MLAN_SC(maxpooling layer aggregation network that incorporate select kernel and contextual Transformer)结构,加入SK(selective kernel)通道注意力机制至下采样阶段,增强关键信息提取能力和特征表达能力。为解决MP(multiple pooling)结构中上下分支特征不平衡的问题,改善误检情况,融入上下文信息提取模块(contextual Transformer block, COT),利用卷积提取上下文信息,将局部信息和全局信息结合起来,使图像特征能够更有效地提取出来。在头部引入SPD卷积(space-to-depth convolution, SPD-Conv),增强小目标的检测能力。用WIoU(wise intersection over union)损失函数替换CIoU(complete intersection over union)损失函数,运用动态聚焦机制,在复杂图像上加强对目标的定位能力。结果 在SSDD(SAR ship detection dataset)数据集和HRSID (high-resolution SAR images dataset)数据集上进行了实验对比,结果表明,改进后的方法相比于YOLOv7,AP(average precision)可达到99.25%和89.73%,分别提升了4.38%和2.57%,准确率和召回率为98.41%,93.24%和94.79%,81.83%,优于对比方法。结论 本文通过融合多重机制改进YOLOv7方法,提升了对目标的定位能力,显著改善了SAR舰船检测中复杂舰船的误检和漏检情况,进一步提高了SAR舰船检测精度。 相似文献
14.
目的 空间位置检索是遥感影像检索中的关键步骤,为进一步提高海量遥感影像编目数据定位检索效率,降低误检率,提出一种基于MPI和OpenMP混合编程模型对射线法进行多层次并行化实现。方法 首先完善传统射线法处理点在多边形边上以及射线与边的端点相交的情况;其次采用MPI实现基于程序层面多机并行,OpenMP实现算法层面单机多线程并行,通过开启多个线程同时处理多边形的各个点,判断它们是否在另一个多边形的内部。结果 当系统中所有节点开启线程数之和等于主节点的最佳线程数时,全局计算速度达到最佳。混合并行算法相比串行算法检索时间减少50%以上,效率更高。结论 MPI+OpenMP混合并行比普通的串行执行、单纯MPI并行或单纯OpenMP并行执行空间定位检索算法效率显著提高,这种并行方案普遍适用于集群环境下的并行程序,并且可以进一步拓展到其他图像处理算法领域。 相似文献
15.
针对混合像元分解误差问题,提出一种基于拉格朗日算法的高光谱解混算法。通过变分增广拉格朗日算法提取出部分端元,由于端元组中存在相似端元影响解混精度,利用基于梯度的光谱信息散度算法进行光谱区分,除去相似端元。通过对得到的端元进行排序,依次增加端元进行光谱解混,将满足条件的端元增加进端元组,最终得到优选端元。该方法不仅有效去除了相似端元的干扰,而且不需要不断搜索端元的组合,根据每个端元对于混合像元的重要性做出相应次数的非限制性最小二乘法计算,得到更精确高光谱端元的子集,该方法对高光谱混合像元解混的效率以及可靠性均有所提高。 相似文献
16.
17.
针对目标在遮挡、尺度变化等复杂场景下易产生模型漂移问题,基于跟踪学习检测(TLD)框架提出一种结合基于网格的运动统计(GMS)检测和置信度判别的长时目标跟踪算法.首先在跟踪模块中采用快速判别尺度空间的相关滤波器(fDSST)作为跟踪器,利用位置滤波器和尺度滤波器对上一帧目标进行位置与尺度的判别,并依据TLD算法中跟踪模... 相似文献
18.
针对目前遥感影像金字塔存储导致数据量过大,以及数据传输完毕再完全解压造成的用户等待问题,结合用户浏览遥感影像的需求,设计了一套面向可视化的遥感影像分级压缩及渐进传输系统。对给定的遥感影像,先采用提出的算法进行高效压缩,然后分为多段码流存入数据库。当用户请求某一区域的特定分辨率层时,系统在数据库查找到对应码流,传输至显示端。显示端实时解压码流后,立即对显示的影像动态更新。对同一区域的更高分辨率影像请求,只需传输增量码流即可。实验表明,该系统能够有效减少数据存储量,并能使遥感影像在虚拟地球平台快速、平滑的发布。 相似文献
19.
交通标示识别在自动驾驶领域有着广泛的应用前景。在实际场景中,光照、地理位置、检测方法等因素会对较小交通标示识别产生影响,导致识别精度降低。针对这些问题,提出一种新型多尺度融合卷积神经网络模型(SF-RCNN)。首先在基础特征提取网络中加入多尺度空洞卷积池化金字塔模块(MASPP),在多尺度空洞卷积采样后,不改变每一个特征下的信息量,而是通过合并通道数来实现特征图的融合,这样既减少了分辨率的损失,也可以捕捉同一图像的上下文信息;其次在网络中增加两个快速拼接模块(F-concat),融合模型中高层与低层的信息,既丰富语义信息,又可以实现不同尺度信息的重复利用;最后在每个最大池化层之前增加批标准化层(BN),转换每一层的数据。尽管增加模块加深了网络深度,但是BN层可以加快模型收敛速度,使整个训练时间不发生较大改变。实验结果表明,该模型利用新型网络结构SF-RCNN,在CCTSDB数据集上进行特征提取,交通标示识别精度均值达到了87.48%,警告类别识别精度达到89.93%,禁令类别识别精度达到89.25%、方向类别识别精度达到81.08%、指示类别识别精度达到89.66%。 相似文献
20.
为对CUDA并行程序内核性能进行分析和预测,从而指导并行程序设计及性能优化,提出一种性能预测框架.1)从GPU编程模型和设备架构细节入手,以线程束为研究单位,通过整合与GPU程序用时密切相关的软硬件基本特征,定义了并行空间闲置度、流处理器线程束负载、并行效应因子等高层次性能相关特征.2)基于上述特征,框架针对线程负载均衡型GPU程序,评估内核函数在不同问题规模以及执行配置下的执行时间.3)依据性能评估原理提出了内核函数执行配置参数的优化策略.验证实验结果表明,该框架在两种典型情境下对现有程序性能的平均预测准确率分别达到89%和94%,客观归纳了高层次特征与程序性能间的相关关系,且能定性分析并行算法性能水平. 相似文献