面向差分隐私保护的随机森林算法 |
| |
引用本文: | 李远航,陈先来,刘莉,安莹,李忠民.面向差分隐私保护的随机森林算法[J].计算机工程,2020,46(1):93-101. |
| |
作者姓名: | 李远航 陈先来 刘莉 安莹 李忠民 |
| |
作者单位: | 中南大学 计算机学院,长沙 410083;中南大学 医疗大数据应用技术国家工程实验室,长沙 410083;中南大学 医疗大数据应用技术国家工程实验室,长沙 410083;中南大学 信息安全与大数据研究院,长沙 410083 |
| |
基金项目: | 湖南省自然科学基金;国家重点研发计划 |
| |
摘 要: | 数据挖掘中的隐私保护问题是目前信息安全领域的研究热点之一。针对隐私保护要求下的分类问题,提出一种面向差分隐私保护的随机森林算法RFDPP-Gini。将随机森林与差分隐私保护相结合,在隐私信息得到保护的同时提高分类的准确率。以CART分类树作为随机森林中的单棵决策树,使用Laplace机制和指数机制添加噪声并选择最佳分裂特征。实验结果表明,RFDPP-Gini算法既能处理离散型特征又能处理连续型特征,在Adult和Mushroom数据集上的分类准确率最高分别达86.335%和100%,且在加入噪声后算法的分类准确率下降幅度极小。
|
关 键 词: | 隐私保护 差分隐私 随机森林 决策树 CART分类树 |
Random Forest Algorithm for Differential Privacy Protection |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 万方数据 等数据库收录! |
|