首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
蒙特卡罗树搜索(Monte Carlo Tree Search,MCTS)在低维离散控制任务中取得了巨大的成功.然而,在现实生活中许多任务需要在连续动作空间进行行动规划.由于连续行动空间涉及的行动集过大,蒙特卡罗树搜索很难在有限的时间内从中筛选出最佳的行动.作为蒙特卡罗树搜索的一个变种,KR-UCT(Kernel Regression UCT)算法通过核函数泛化局部信息的方式提高了蒙特卡罗树搜索在低维连续动作空间的模拟效率.但是在与环境交互的过程中,为了找出最佳的行动,KR-UCT在每一步都需要从头进行大量的模拟,这使得KR-UCT算法仅局限于低维连续行动空间,而在高维连续行动空间难以在有限的时间内从行动空间筛选出最佳的行动.在与环境交互的过程中,智能体可以获得环境反馈回来的信息,因此,为了提高KR-UCT算法在高维行动空间的性能,可以使用这些反馈信息剪枝树搜索过程来加快KR-UCT算法在高维连续行动空间的模拟效率.基于此,文中提出了一种基于策略-价值网络的蒙特卡罗树搜索方法(KR-UCT with Policy-Value Network,KRPV).该方法使用策略-价值网络保存智能体与环境之间的交互信息,随后策略网络利用这些信息帮助KR-UCT算法剪枝KR-UCT搜索树的宽度;而价值网络则通过泛化不同状态之间的价值信息对蒙特卡罗树搜索在深度上进行剪枝,从而提高了KR-UCT算法的模拟效率,进而提高了算法在高维连续行动任务中的性能.在OpenAI gym中的4个连续控制任务上对KRPV进行了评估.实验结果表明,该方法在4个连续控制任务上均优于KR-UCT,特别是在6维的HalfCheetah-v2任务中,使用KRPV算法所获得的奖励是KR-UCT的6倍.  相似文献   

2.
冯斌  石锦风  孙俊 《计算机工程与设计》2007,28(23):5690-5693,5786
针对现行的遗传算法存在进化速度过慢和过早收敛的局限,以及粒子群优化算法搜索空间有限、容易陷入局部最优点的缺陷,提出将一种基于量子行为的粒子群优化算法应用于作业车间调度问题.将该问题中的每个调度组成一个多维向量,以此向量作为量子粒子群优化算法中的粒子进行进化,由此在解空间内搜索最优解.实例仿真结果表明,该算法收敛速度快、全局收敛性能好,可以得到比遗传算法、粒子群优化算法更佳的调度效果,证明了算法的有效性.  相似文献   

3.
宋存利  时维国 《信息与控制》2012,41(2):193-196,209
针对车间调度问题,提出了一种2阶段混合粒了群算法(TS-HPSO).该算法在第1阶段为每个粒子设置较大的惯性系数w,同时去掉了粒子的社会学习能力,从而保证每个微粒在局部范围内充分搜索.第2阶段的混合粒子群算法以第1阶段每个粒子找到的最好解作为初始解,同时以遗传算法中的变异操作保证粒了多样性;为保证算法的寻优能力,对全局gbest进行贪婪邻域搜索.计算结果证明了本算法的有效性.  相似文献   

4.
程利新  石峰 《计算机工程》2006,32(4):15-17,38
为了使得综合系统能够自动综合经设计迭代后由反向标注得到的时序信息,同时提高综合结果与模拟结果的时序一致性,对作为时序信息载体的延时语句的综合方法进行了研究,将延时语句考虑为延时约束,并提出了相应调度模型DTC_DFG及其调度算法。采用启发式机制使得调度算法的解空间搜索过程具有跳出局部最优的能力,此算法可在多项式时间复杂度下得到全局最优调度解。实验结果表明,该制度算法不仅能够有效综合延时语句,使得综合结果能够与模拟结果达到较好的一致,而且提供了一种给出延时约束的方便手段,减少了综合过程中的人工干预,极大地提高了设计效率。  相似文献   

5.
针对蛋白质高维构象空间搜索问题,提出一种基于副本交换的局部增强差分进化蛋白质结构从头预测方法(RLDE)。首先,采用基于知识的Rosetta粗粒度能量模型显著降低构象空间优化变量维数;其次,引入基于片段库知识的片段组装技术进一步减小构象搜索空间,有效避免搜索过程中的熵效应;此外,在每个副本层设置构象种群,采用差分进化算法对种群进行更新,然后利用Monte Carlo算法对种群做局部增强,以此得到全局和部分局部最优构象。综上,RLDE利用差分进化算法较强的全局搜索能力可以对构象空间进行有效的全局搜索;借助Monte Carlo算法局部搜索性能对构象空间局部极小区域进行更为充分的采样;副本交换策略保证了副本层中种群的多样性,同时能够增强算法跳出局部极小的能力,从而使得算法对构象空间的搜索能力进一步增强。15个目标蛋白测试结果表明,所提方法能够有效地对构象空间采样,得到高精度的近天然态蛋白质构象。  相似文献   

6.
置换表示方法求解多卫星多地面站调度问题   总被引:1,自引:0,他引:1  
针对多卫星成像和多地面站数传并存的对地成像调度问题,从置换空间到调度解空间的映射方法和置换空间的搜索算法两方面进行了研究.提出了一种数传时间窗优先的置换序列映射算法,并证明该映射算法可以将置换序列映射到调度解空间上的最优解.提出了一种遗传随机搜索算法,基于有记忆随机邻域搜索,在置换空间上进行搜索.仿真计算表明,随机邻域搜索可以增强遗传算法的局部搜索能力,搜索结果平均获得了4.64%的改进.  相似文献   

7.
基于混合蚁群算法的网格任务调度   总被引:4,自引:2,他引:2       下载免费PDF全文
魏东  吴良杰  佐丹  刘刚 《计算机工程》2010,36(3):215-217
针对网格任务调度的调度时间长、资源负载不平衡等问题,提出一种基于混合蚁群算法的网格任务调度方法。该方法将禁忌搜索作为蚁群算法的局部搜索策略,以扩大解的搜索空间,避免陷入局部最优,并通过多样化机制提高算法收敛速度。利用平衡因子调节信息素的更新,改善资源的负载平衡性能。  相似文献   

8.
基于模拟谐振子算法的多项目调度   总被引:1,自引:0,他引:1  
倪霖  段超  钟辉 《计算机应用》2011,31(9):2559-2562
针对资源受限多项目调度问题(RCMPSP),介绍了一种模拟谐振子算法。算法通过模拟简谐振动系统中势能状态的变化,从经典简谐振动阶段过渡到量子振动阶段,从而实现全局搜索到局部搜索的变化过程;同时,两阶段的搜索形式使算法的收敛精度和搜索效率得到了保证。采用基于排列的方法和串行项目进度生成机制,结合多项目的任务列表,可以保证所得调度方案满足项目优先关系约束。运用标准测试函数对算法进行了测试,结果表明算法具有高质量的搜索效率和精度。最后给出了三组多项目调度算例。  相似文献   

9.
根据柔性车间调度问题提出基于解空间距离聚类和变邻域搜索的粒子群算法.在粒子群算法基础上采用贪婪策略引入变邻域搜索方式,即调整关键路径上最大关键工序的机器位置,调整关键路径上工序相对位置变化,加强局部搜索能力;根据机器加工工序的空间距离,采用K-means聚类得到机器加工工序“优良个体”,加大局部搜索性能.同时对于粒子群算法速度更新采用局部停滞策略,保留局部片段相对位置不变特性.通过实验仿真,优化算法取得了较好的效果,与一般的粒子群算法相比较收敛速度迅速且性能良好.  相似文献   

10.
基于索引数组与集合枚举树的最大频繁项集挖掘算法   总被引:2,自引:0,他引:2  
由于其内在的计算复杂性,挖掘密集型数据集的全部频繁项集非常困难,解决方案之一是挖掘最大频繁项集。集合枚举树是最大频繁项集挖掘算法中常用的数据结构,最大频繁项集的挖掘过程也可以看作是集合枚举树的搜索过程。为缩小集合枚举树的搜索空间,采用宽度优先和深度优先相结合的混合搜索策略,提出了一种新的最大频繁项集的挖掘算法Index-MaxMiner。该算法首先设计了索引数组这种新的数据结构,并给出了一个基于二进制位图技术的索引数组的计算方法。通过为每个频繁项增加包含索引,Index-MaxMiner利用一次宽度优先搜索得到了候选最大频繁项集,使集合枚举树的第一层结点个数大幅度减少。然后在候选最大频繁项集中通过深度优先搜索,得到全部最大频繁项集,从而实现了集合枚举树的跳跃式搜索,大大缩小了搜索空间。实验结果表明,该算法可有效提高最大频繁项集的挖掘效率。  相似文献   

11.
货物在配送中心仓储空间内的定位可以描述为一个NP-Hard的装填问题。把仓储空间分为若干单位空间,并结合空间、时间性质,提出了货物存储空间动态调度的优化算法,在一段连续的调度计划时间段内,整个调度方法被分成三部分。第一部分通过考虑空间约束、离库时间产生对应于不同时间片的货物初步分组集合。第二部分设计了遗传算法来实现初步分组后的货物在单位空间内的优化布局。由于GA的全局搜索特性及精华策略、去负策略的应用,可以实现一个单位空间内的较优货物布局方案。为了克服零散货物占用空间的问题,第三部分是进行手工微调。最后两个仿真例子验证了所提方法的有效性。  相似文献   

12.
A spatial scheduling system and its application to shipbuilding: DAS-CURVE   总被引:4,自引:0,他引:4  
Spatial scheduling considers not only traditional scheduling constraints like resource capacity and due dates, but also dynamic spatial layout of the objects. Automation of spatial scheduling is particularly important when the spatial resources are critical bottleneck resources, as is the case in the shipbuilding industry. To develop a spatial scheduling expert system for shipbuilding, a methodology for spatial layout of polygonal objects within rectangular plates is first developed. This study is then extended to the methodology for spatial scheduling, including the time dimension. The methodology is applied to the scheduling of Daewoo shipbuilding to build a system DAS-CURVE. DAS-CURVE is successfully operational and its experimental performance is remarkable.  相似文献   

13.
We propose a new approach for scheduling with strict deadlines and apply this approach to the Time-Constrained Project Scheduling Problem (TCPSP). To be able to meet these deadlines, it is possible to work in overtime or hire additional capacity in regular time or overtime. For this problem, we develop a two stage heuristic. The key of the approach lies in the first stage in which we construct partial schedules. In these partial schedules, jobs may be scheduled for a shorter duration than required. The second stage uses an ILP formulation of the problem to turn a partial schedule into a feasible schedule, and to perform a neighborhood search. The developed heuristic is quite flexible and, therefore, suitable for practice. We present experimental results on modified RCPSP benchmark instances. The two stage heuristic solves many instances to optimality, and if we substantially decrease the deadline, the rise in cost is only small.  相似文献   

14.
为了保证轧制调度计划的可行性,提高排程的效率,根据热轧生产模式和轧制计划的特点,利用车辆路径问题模型来建模轧制调度问题,并用一种基于离散人工免疫算法的混合优化算法来解决这一问题。该方法利用离散人工免疫算法的全局搜索能力来寻找全局最优解,利用模拟退火方法来避免陷入局部最优.对某钢厂实际生产数据仿真结果表明,所提出的模型和算法对于求解热轧调度问题具有可行性和高效性。  相似文献   

15.
方刚 《计算机工程》2011,37(18):38-40
在空间拓扑关联挖掘中,为提取包含指定空间布局关系的拓扑关联规则,提出一种基于空间布局约束的拓扑关联规则挖掘算法,该算法能够在多空间关系模式下,挖掘包含空间布局约束的拓扑关联规则,将空间关系事务转换成整数,通过空间布局约束重构非目标空间对象类的权值向量,用重构权位值递减构建候选频繁项,并用布尔运算计算其支持数。实验结果表明,与传统挖掘算法相比,该算法的挖掘速度更快、更有效。  相似文献   

16.
集装箱堆场预倒箱问题的混合优化算法   总被引:2,自引:0,他引:2  
堆场出口箱区通常通过集装箱的预倒箱操作来提高后续装船作业的效率. 为此, 开发了由邻域搜索算法与整数规划算法组成的两阶段混合算法对预倒箱问题进行优化, 第1 阶段通过启发式规则压缩末终堆存状态空间, 第2 阶段通过整数规划算法缩短第1 阶段得到的预倒箱序列的长度. 两个阶段循环交替进行以快速求得最优的预倒箱序列. 借助不同种类仿真算例的实验结果及与现有研究方法下所得结果的对比, 验证了混合优化算法的有效性和实用性.  相似文献   

17.
This paper presents a formulation and an algorithm for the winner determination problem in auction-based scheduling. Without imposing a time line discretization, the proposed approach allows bidders to bid for the processing of a set of jobs using a requirement-based bidding language, which naturally represents scheduling constraints. The proposed winner determination algorithm uses a depth first branch and bound search. The search branches on bids, and a constraint-directed scheduling procedure is used at each node to verify the feasibility of the temporary schedule. Experiments show that the proposed algorithm is on average more than an order of magnitude faster than a commercial optimization package, CPLEX 10.0.  相似文献   

18.
空间并置(co-location)模式挖掘旨在发现空间特征间的关联关系,是空间数据挖掘的重要研究方向。基于列计算的空间并置模式挖掘方法(CPM-Col算法)避开挖掘过程中最耗时的表实例生成操作,直接搜索模式的参与实例,成为当前高效的方法之一。然而,回溯法搜索参与实例仍是该方法的瓶颈,尤其在稠密数据和长模式下。为加速参与实例的搜索,充分利用CPM-Col算法搜索参与实例时得到的行实例,在不增加额外计算的前提下对CPM-Col算法进行两点改进。首先,将CPM-Col算法搜索到的行实例存储为部分表实例,利用子模式的部分表实例快速确定参与实例,避免了大量实例的回溯计算。其次,在CPM-Col算法获得一条行实例后,利用行实例的子团反作用于第一个特征,得到第一个特征的参与实例,避免了这些实例的回溯搜索。由此,提出了基于改进列计算的空间并置模式挖掘算法(CPM-iCol算法),并讨论了算法的复杂度、正确性和完备性。在合成数据和真实数据集上进行了实验,与经典的传统算法join-less和CPM-Col算法对比,CPM-iCol算法明显降低了挖掘的时间,减少了回溯的次数。实验结果表明,该算法比CPM-Col具有更好的性能和可扩展性,特别在稠密数据集中效果更加明显。  相似文献   

19.
为了求解炼钢-连铸动态调度问题,提出了一种将拉格朗日插值算法与差分进化算法相融合得到的改进的差分进化算法。改进后的差分进化算法通过自适应调整进化参数,动态的调整差分进化的方向,并结合拉格朗日插值来优化差分进化算法的局部搜索能力,引入权重系数对全局搜索和局部搜索加以平衡。针对国内某大型钢厂的实际生产数据建立实验模型,以最小化总完工时间、最小化总断浇时间、最小化炉次间总等待时间和最小化总偏差量时间为目标,将改进的差分进化算法应用于求解炼钢-连铸转炉出现故障的动态扰动事件调度问题,实验结果表明,改进的差分进化算法应用在炼钢-连铸动态调度问题上,有效的缩短了炉次加工总完工时间、炉次间总等待时间和总断浇时间,在合理范围内,有效控制了新生产的调度计划与原始调度计划的时间偏差量,避免了因扰动事件的发生而引起连铸机断浇。  相似文献   

20.
一种基于神经网络的生产调度方法   总被引:10,自引:1,他引:9  
提出解决具有开、完工期限制的约束Job-shop生产调度问题的一种神经网络方法. 该方法通过约束神经网络,描述各种加工约束条件,并对不满足约束的开工时间进行相应调 节,得到可行调度方案;然后由梯度搜索算法优化可行调度方案,直至得到最终优化可行调度 解.理论分析、仿真实验表明了方法的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号