首页 | 本学科首页   官方微博 | 高级检索  
     

反应堆过程控制强化学习可靠性评估方法研究
引用本文:乔宇,颜瑞,黄百健,姚文卿,王少华,陈日罡.反应堆过程控制强化学习可靠性评估方法研究[J].自动化仪表,2023(S1):361-365.
作者姓名:乔宇  颜瑞  黄百健  姚文卿  王少华  陈日罡
作者单位:1.北京大学软件与微电子学院102627;2.中国核电工程有限公司100840;
摘    要:人工智能技术的发展推动了强化学习(RL)算法在工业过程控制中的应用。在航空、航天和核能等行业中,不仅要求控制算法准确性高,还对控制算法的可靠性提出高要求。对RL领域的可靠性评估方法进行了研究,提出了反应堆过程控制RL可靠性评估方法。该方法通过分析模型的推理性能以评估RL模型的决策能力,并创新性地提出了针对传感?控制系统的对抗样本(AE)生成方法。通过AE测试评估RL模型的抗干扰能力。利用所提评估方法对反应堆过程控制RL模型进行了可靠性评估。试验结果表明,所提方法可以评估实际应用中RL模型的可靠性。该研究为人工智能技术在反应堆控制应用的可靠性评估工作以及RL领域对抗测试方法研究提供参考。

关 键 词:反应堆过程控制  可靠性评估  强化学习  人工智能  对抗性测试  对抗样本
本文献已被 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号