排序方式: 共有13条查询结果,搜索用时 15 毫秒
1.
通过扩展的省级生产函数计算边际单位水资源价值,构造相关生产函数来描述我国大陆各省、市(自治区)的经济活动。利用2000—2005年的经济数据以及水资源数据,从生产力角度分析各地区的水资源利用状况。分析结果表明,我国大陆各省、市(自治区)以边际水资源利用价值为表征的水资源使用效率在研究期限内都有所提高,北方等缺水地区无论从空间还是从时间段来看,水资源利用效率及其改进幅度都显著地高于南方地区。在此基础上提出了有关政策建议。 相似文献
2.
3.
随着深度学习和强化学习研究取得长足的进展,多Agent强化学习已成为解决大规模复杂序贯决策问题的通用方法。为了推动该领域的发展,从竞争与合作的视角收集并总结近期相关的研究成果。该文介绍单Agent强化学习;分别介绍多Agent强化学习的基本理论框架——马尔可夫博弈以及扩展式博弈,并重点阐述了其在竞争、合作和混合三种场景下经典算法及其近期研究进展;讨论多Agent强化学习面临的核心挑战——环境的不稳定性,并通过一个例子对其解决思路进行总结与展望。 相似文献
4.
降低硝酸氧化法制备乙醛酸工艺中的乙二醛含量 总被引:1,自引:0,他引:1
通过对硝酸氧化法制备乙醛酸工艺中硝酸、盐酸、亚硝酸钠的加入量以及反应时间对于产品乙醛酸中乙二醛质量分数的影响的研究,确定了降低硝酸氧化法制备乙醛酸中乙二醛含量的工艺条件。质量分数为40%的乙二醛与质量分数为38%的盐酸按照摩尔比1∶0.18加入反应器,乙二醛与硝酸的摩尔比为1∶0.85,45℃恒温滴加硝酸,1.5 h滴加结束并升温至60℃反应3 h。使得产品中乙二醛的质量分数由2.3%~2.9%降低至0.624%~0.627%。 相似文献
5.
以苄川氯和氯磺酸制备间磺酰氯基苯甲酰氯,再以间磺酰氯基苯甲酰氯和氯苯在无水三氯化铝催化剂下反应制备1-(对氯苯甲酰基)-3-(对氯苯磺酰基)苯,以DMAc为溶剂,1-(对氯苯甲酰基)-3-(对氯苯磺酰基)苯和双酚A为单体合成新型聚芳醚砜酮,通过FT-IR和1H-MNR对聚合物的结构进行了表征并通过TG、DSC进行了性能测试。结果表明,含有间位砜酮结构的新型聚芳醚砜酮具有良好的热稳定性和可溶性。 相似文献
6.
7.
8.
适应粘性土壤地区稻茬麦播种联合作业机的设计与性能试验 总被引:1,自引:0,他引:1
针对江淮、黄淮粘性土壤地区稻茬麦面临的作业难度大、秸秆还田后埋茬不深等问题,研制了SGT-360224A24型反旋施肥播种镇压联合作业机,并进行性能试验。①研制的SGF-360224A24型联合作业机,由75kw拖拉机驱动,采用半悬挂,能耗低,一次作业即可完成旋耕、施肥、播种、开沟播种、镇压等工序;②田间性能试验表明:SGT-360224A24型联合作业机特别是对于粘土地具有良好的适应性和播种效果;③播种阶段反向旋耕深度8~10cm,适宜播种量260-375kg/hm^2、施氮量150~180kg/hm^2。 相似文献
9.
10.
蒙特卡罗树搜索(Monte Carlo Tree Search,MCTS)在低维离散控制任务中取得了巨大的成功.然而,在现实生活中许多任务需要在连续动作空间进行行动规划.由于连续行动空间涉及的行动集过大,蒙特卡罗树搜索很难在有限的时间内从中筛选出最佳的行动.作为蒙特卡罗树搜索的一个变种,KR-UCT(Kernel Regression UCT)算法通过核函数泛化局部信息的方式提高了蒙特卡罗树搜索在低维连续动作空间的模拟效率.但是在与环境交互的过程中,为了找出最佳的行动,KR-UCT在每一步都需要从头进行大量的模拟,这使得KR-UCT算法仅局限于低维连续行动空间,而在高维连续行动空间难以在有限的时间内从行动空间筛选出最佳的行动.在与环境交互的过程中,智能体可以获得环境反馈回来的信息,因此,为了提高KR-UCT算法在高维行动空间的性能,可以使用这些反馈信息剪枝树搜索过程来加快KR-UCT算法在高维连续行动空间的模拟效率.基于此,文中提出了一种基于策略-价值网络的蒙特卡罗树搜索方法(KR-UCT with Policy-Value Network,KRPV).该方法使用策略-价值网络保存智能体与环境之间的交互信息,随后策略网络利用这些信息帮助KR-UCT算法剪枝KR-UCT搜索树的宽度;而价值网络则通过泛化不同状态之间的价值信息对蒙特卡罗树搜索在深度上进行剪枝,从而提高了KR-UCT算法的模拟效率,进而提高了算法在高维连续行动任务中的性能.在OpenAI gym中的4个连续控制任务上对KRPV进行了评估.实验结果表明,该方法在4个连续控制任务上均优于KR-UCT,特别是在6维的HalfCheetah-v2任务中,使用KRPV算法所获得的奖励是KR-UCT的6倍. 相似文献