反应堆过程控制强化学习可靠性评估方法研究 |
| |
引用本文: | 乔宇,颜瑞,黄百健,姚文卿,王少华,陈日罡.反应堆过程控制强化学习可靠性评估方法研究[J].自动化仪表,2023(S1):361-365. |
| |
作者姓名: | 乔宇 颜瑞 黄百健 姚文卿 王少华 陈日罡 |
| |
作者单位: | 1.北京大学软件与微电子学院102627;2.中国核电工程有限公司100840; |
| |
摘 要: | 人工智能技术的发展推动了强化学习(RL)算法在工业过程控制中的应用。在航空、航天和核能等行业中,不仅要求控制算法准确性高,还对控制算法的可靠性提出高要求。对RL领域的可靠性评估方法进行了研究,提出了反应堆过程控制RL可靠性评估方法。该方法通过分析模型的推理性能以评估RL模型的决策能力,并创新性地提出了针对传感?控制系统的对抗样本(AE)生成方法。通过AE测试评估RL模型的抗干扰能力。利用所提评估方法对反应堆过程控制RL模型进行了可靠性评估。试验结果表明,所提方法可以评估实际应用中RL模型的可靠性。该研究为人工智能技术在反应堆控制应用的可靠性评估工作以及RL领域对抗测试方法研究提供参考。
|
关 键 词: | 反应堆过程控制 可靠性评估 强化学习 人工智能 对抗性测试 对抗样本 |
本文献已被 维普 等数据库收录! |
|