基于生成对抗网络的数据不确定性量化方法 |
| |
引用本文: | 王昊,王子成,张超,马韵升.基于生成对抗网络的数据不确定性量化方法[J].计算机应用,2023(4):1094-1101. |
| |
作者姓名: | 王昊 王子成 张超 马韵升 |
| |
作者单位: | 1. 大连理工大学数学科学学院;2. 山东京博控股集团有限公司 |
| |
基金项目: | 国家重点研发计划项目(2020YFB1711104)~~; |
| |
摘 要: | 针对直接使用高维、高频、含有噪声的现实世界数据进行数据处理时会导致估计器不可靠的问题,提出一种基于生成对抗网络(GAN)的数据不确定性量化方法。首先,通过GAN重构原始数据分布,构建噪声空间到原始数据空间的映射分布;其次,使用马尔可夫链蒙特卡洛(MCMC)方法抽取样本,从而得到基于原始数据分布的新样本;然后,基于指定的函数定义样本的不确定性置信区间;最后,使用置信区间对原始数据进行不确定性估计,并选择置信区间内的数据作为估计器使用的数据。实验结果表明,与使用原始数据相比,使用置信区间内的数据进行估计器训练达到性能上限所需要的样本数减少了50%;同时,对比原始训练数据,置信区间内的数据在达到相同测试精度时所需要的样本数平均降低了30%。
|
关 键 词: | 生成对抗网络 不确定性量化 马尔可夫链蒙特卡洛方法 置信区间 不确定性估计 |
|