首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 11 毫秒
1.
针对连续状态空间下的强化学习算法初始性能差及收敛速度慢的问题,提出利用自适应势函数塑造奖赏机制来改进强化学习算法。该机制通过额外的奖赏信号自适应地将模型知识传递给学习器,可以有效提高算法的初始性能及收敛速度。鉴于径向基函数(RBF)网络的优良性能及存在的问题,提出利用自适应归一化RBF(ANRBF)网络作为势函数来塑造奖赏。基于ANRBF网络提出了梯度下降(GD)版的强化学习算法——ANRBF-GD-Sarsa(λ)。从理论上分析了ANRBF-GD-Sarsa(λ)算法的收敛性,并通过实验验证了ANRBF-GD-Sarsa(λ)算法具有较好的初始性能及收敛速度。  相似文献   

2.
3.
针对使用固定模型滤波算法跟踪机动目标时滤波精度依赖于模型固有参数的问题,提出了一种基于期望模型的自适应Singer模型滤波算法。首先利用3组代表不同机动强弱的典型Singer模型组成基础模型集合,然后通过实时计算目标综合残差确定目标机动等级,根据目标机动等级的变化来生成期望模型,并实时扩充基础模型集合进行交互式多模型(Interacting Multiple Model,IMM)滤波。该算法降低了对基础模型选取的依赖性,具有更好的环境适应性,在目标不同机动状态下都能进行准确跟踪。  相似文献   

4.

在动态干扰环境下的多节点无线传感器网络中,随着状态-动作空间的增大,传统强化学习难以收敛. 为克服这一问题,本文提出一种基于迁移强化学习的快速抗干扰算法,即将多智能体Q学习和值函数迁移方法相结合. 首先,将多节点通信抗干扰问题建模为马尔科夫博弈;然后,引入互模拟关系度量不同状态-动作对之间的相似性;最后,采用多智能体Q学习算法学习抗干扰策略,并在每一步Q值更新后,根据不同状态-动作对之间的相似性进行值函数迁移. 仿真结果表明,在分时隙传输的在线抗干扰问题中,所提算法的抗干扰性能显著优于正交跳频法和随机跳频法,在达到相同抗干扰效果时,所需的迭代次数远少于常规Q学习算法.

  相似文献   

5.
朱佩佩  吴元  赖作镁 《电讯技术》2022,62(5):619-624
无人机目标检测与识别任务中,目标随着飞行高度的改变尺寸发生显著变化。常规目标检测模型中,获取的小目标细节信息有限,检测精度较低;而适用于小目标的实时检测模型往往容易丢失大目标的背景信息,降低大目标的检测精度。针对以上多尺度目标检测识别任务难点,提出一种基于改进特征金字塔网络(Feature Pyramid Network, FPN)结构的实时多尺度目标检测识别模型。该模型通过增加特征金字塔层级覆盖更广的目标尺度,获取更为丰富的目标信息;同时,利用跨连接增加不同尺度特征融合的多样性,降低特征传导距离,保留更加完整的尺度特征来提高模型检测识别多尺度目标的性能。通过实验发现,相比于原始网络结构和相同特征层级的四层特征金字塔结构,加入改进特征金字塔结构的多尺度目标检测模型识别性能得到了提升。  相似文献   

6.
一种新的机动目标跟踪的多模型算法   总被引:5,自引:1,他引:4  
设计了一种仅仅使用两个模型实现对机动目标精确跟踪的多模型算法,采用了含有法向和切向加速度的加速度均值自适应的当前统计模型和扩展后的常速模型进行交互。该算法不受目标转弯率大小和变化的限制,对目标运动模式的未知参数变化的适应性较强。仿真结果表明,该算法对目标的跟踪精度明显优于传统的使用3个以上模型交互的IMM-CV/CT算法。由于本算法能够估计出目标的法向和切向加速度,进行适当的模型集设计后,可以实现对复杂、快速机动目标的全过程跟踪,具有可扩展性的应用前景。  相似文献   

7.
密集异构网络(Dense Heterogeneous Network, DHN)通过部署小基站可以提升网络容量和用户速率,但小基站的密集部署会产生巨大的能耗和严重的干扰,进而影响系统的能量效率(Energy Efficiency, EE)和频谱效率(Spectral Efficiency, SE)。在保证用户服务质量(Quality of Service, QoS)需求的前提下,为了联合优化系统的能量效率和频谱效率,研究了密集异构网络中下行链路的资源分配(Resource Allocation, RA)问题。首先,将频谱和小基站发射功率分配问题建模为联合优化系统能量效率和频谱效率的多目标优化问题;其次,提出了基于单策略多目标强化学习(Single-strategy Multi-objective Reinforcement Learning, SMRL)的资源分配算法求解所建立的多目标优化问题。仿真结果表明,与基于单目标强化学习的资源分配算法相比,所提算法可以实现系统能量效率和频谱效率的联合优化,与基于群体智能算法的资源分配算法相比,所提算法的系统能量效率提高了1%~1.5%,频谱效率...  相似文献   

8.
采用距离和信息的多基地雷达多目标投影定位算法中,距离向脉冲压缩后分辨率降低,需要已知空间中目标个数.针对此问题,提出了一种稀疏重建的多基地雷达多目标定位方法.该方法利用多个接收机中目标稀疏度相同的特点,通过构造平均重构残余误差变化率和平均散射系数变化率作为正交匹配追踪(OMP)算法迭代终止判定条件,自适应地终止OMP算法的同时获得稀疏重建信号以及信号稀疏度的估计值,提高了距离向分辨率,获得了对空间中目标个数的估计.仿真实验表明所提算法有效抑制了距离向主瓣展宽和旁瓣串扰,提高了距离向分辨率.同时,所提算法在不同噪声环境下能准确估计空间中目标个数并提取其空间位置,实现对空间中目标的准确定位.  相似文献   

9.
谢承旺  张飞龙  陆建波  肖驰  龙广林 《电子学报》2019,47(11):2359-2367
现实中的多目标优化问题不断增多且日益复杂,需要不断发展新型启发式算法应对挑战.提出一种多策略协同的多目标萤火虫算法MOFA-MCS.该算法采用均匀化与随机化相结合的方法产生初始种群;利用档案集中的精英解个体指导萤火虫移动;并在移动的过程施加Lévy flights随机扰动;最后,利用ε-三点最短路径策略维护档案解群的多样性.MOFA-MCS算法与其他6种经典的多目标进化算法一同在12个基准的多目标测试问题上进行实验,结果表明所提算法在收敛性、多样性方面总体上具有显著的性能优势.  相似文献   

10.
11.
提出了一种改进的多目标优化问题的蚁群算法.算法选择进化算法的定义的时候,种群中一定数量的个体信息来源作为中心的扩散,多个中心点之间有一定的距离;群体中的其他个体按照离源个体最近的距离的原则归属于其中一个信息素扩散源;按照信息素扩散算法,每一信息素扩散源中的个体获得源于中心点的信息素;保留每一代群体中的中心点到下一代种群中,确保了收敛性和维护种群的多样性.最后利用多目标背包问题来测试算法的性能,并与MOA和NSGA-II算法进行了分析比较.结果表明,该搜索效率高,向真实Pareto前沿逼近效果好,得到传播的多种解决方案,是一个多目标优化问题的解决和有效的方法.  相似文献   

12.
13.
近年来,期望传播(Expectation Propagation,EP)算法被广泛应用于多输入多输出(Multiple-Input Multiple-Output,MIMO)信号检测。EP是一种优良的贝叶斯推断算法,能够良好匹配信号检测工作所对应的贝叶斯模型,是目前接近最优检测算法的先进检测算法之一。面向6G,EP可在诸多场景达成高性能信号检测,对未来超高可靠通信需求提供支撑,具有实际研究意义。然而,当前研究缺乏该算法的综述性分析,相关研究人员缺乏直观学习参考。概述了基于期望传播算法的MIMO信号检测架构以及相关技术研究现状,总结了现有问题并展望了未来研究挑战,旨在为相关研究人员提供思路,为EP信号检测算法服务6G实际通信场景做出贡献。  相似文献   

14.
一种基于随机码本的运动目标检测算法   总被引:2,自引:2,他引:0  
针对传统码本算法模型建立时间过长、更新效果 差等问题,将视觉背景提取(ViBe)算法中模型建 立和更新的 思想用于改进码本算法,提出了一种基于随机码本(RCB)的运动目标检测算法。为减少计算 量,提出了一种基于 YUV空间的码本模型;为减少背景建模时间、提高模型的洁净度 ,提出了随机选取第1帧图像空间领域内 像素点的码本训练方法;为提高背景模型对复杂场景的适应能力,提出了基于随机策略的码 本更新方式。 与典型算法进行了两组实验。结果表明,本文算法兼有二者的优点,不仅能迅速适应场 景的转换,而 且在检测精度、动态适应能力和实时性等方面都有较大提高。  相似文献   

15.
针对空时自适应处理(STAP)中样本不足导致动目标检测性能下降的问题,该文提出在多频多通道系统下综合利用空-时-频数据的自适应处理方法。该方法在分析不同频率杂波特性差异的基础上,采用杂波协方差矩阵重构以达到自适应修正不同频率下杂波功率的目的,最后通过融合不同频率数据的空时采样协方差矩阵获得高精度的杂波子空间估计效果。仿真结果显示,在样本数较少的情况下,该方法具有良好的动目标检测效果。  相似文献   

16.
马菁涛  陶海红  黄鹏辉 《电子学报》2016,44(7):1605-1612
由于分辨精度有限以及易受目标能量强弱的影响,基于Fast Fourier Transform(FFT)的算法不能对位于同一距离单元的密集强弱目标进行有效的速度估计.基于此,本文采用基于协方差矩阵迭代自适应(Iterative Adaptive Algorithm,IAA)的改进Capon(Modified Capon,MCapon)算法对密集强弱目标速度参数进行高分辨估计.该方法首先采用Keystone变换进行距离走动校正,然后利用目标所在的距离单元数据进行协方差矩阵重构,接着利用MCapon方法使得密集强弱目标信号幅度输出均为常数1,最后实现了速度的高分辨估计,在保持高分辨的同时提高了稳健性.理论分析和实验仿真结果表明,所提方法可对包络校正后位于同一距离单元的密集强弱目标径向速度参数进行有效的高分辨估计,估计性能优于FFT类方法及子空间投影方法.  相似文献   

17.
多集合分裂可行性问题就是要找距一族非空闭凸集最近的点,并且使得其线性变换的像距离另一族非空闭凸集最近.多集合分裂可行性问题是一类重要的最优化问题,产生于工程实践,在信号处理领域中有着广泛的应用.文中给出基于求解分裂可行问题的投影算法,该算法不需要计算矩阵谱半径,并且在迭代过程中,步长的选取不用反复从初始值开始计算,进而减小计算的工作量,提高算法的运算效率.同时该算法具有较好的稳定性,还证明了算法的全局收敛性,并且进行了数值实验,实验结果表明该算法具有较快的收敛速度和良好的可行性.  相似文献   

18.
为提高多目标粒子群算法在解决复杂多目标优化问题中的整体性能,提出一种多策略融合的多目标粒子群算法.该算法采用均匀化与随机化相结合的方式初始化种群,在粒子速度更新中新增一扰动项,运用简化的k-最近邻方法维持档案以及对档案个体赋予生存期属性并动态调整生存期值.实验结果表明,在GD和SP性能指标上,本文算法与另外5种对等算法在ZDT和DTLZ系列测试问题上进行对比,其表现出了总体显著性的性能优势.  相似文献   

19.
自适应环路滤波(ALF)是面向高清的多视点视频编码(MVC)中的一项新的滤波技术,虽然能提高视频压缩的主观质量和客观质量,但是其复杂度过高阻碍了其实时应用。本文提出了一种低复杂度的ALF算法,充分利用了视点间相关性和层间相关性以减少亮度和色度分量的分割次数,并且能自适应跳过大部分帧的块控制(DBC)处理过程。实验结果表明,所提出的算法能在保证视频主观质量和客观质量基本不变的情况下减少61%左右的ALF处理时间。因此,所提出的方法在编码效率和复杂度上做到了很好的折中处理,并且能很好地改善ALF的性能。  相似文献   

20.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号