首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 640 毫秒
1.
基于差分隐私下包外估计的随机森林算法   总被引:1,自引:0,他引:1  
针对差分隐私随机森林算法在对高维数据进行分类时准确率不理想的问题,本文通过引入差分隐私下的包外估计来计算决策树权重以及特征权重,从而提出一种基于差分隐私下包外估计的随机森林算法(random forest under differential priva-cy based on the out-of-bag estim...  相似文献   

2.
轨迹隐私保护中使用k-means算法进行聚类时,对初始值敏感,且聚簇数目的选择具有一定的盲目性,为解决该问题并提高聚类结果的可用性,提出一种结合k-shape和差分隐私的轨迹隐私保护方案KSDP(k-shape differential privacy).首先,对轨迹数据进行划分切割预处理,利用轨迹的时间属性和空间属性对轨迹切割划分,从而提高聚类泛化的质量.其次,使用设定的效用函数对预处理后的轨迹数据进行评判,并对过滤后数据进行聚类泛化操作.最后,在泛化后的数据中加入Laplace噪声,使其满足差分隐私保护模型,进一步保护轨迹隐私.实验仿真结果表明,与传统差分隐私k-means聚类方案对比,KSDP方案有效提高了聚类结果的可用性,并具有一定的性能优势,更好地实现了轨迹数据发布和隐私保护.  相似文献   

3.
针对高维相关数据发布的隐私保护问题,本文提出2种隐私保护数据发布方法,解决高维相关数据发布时重复加噪导致的发布数据效用过低问题。基于概率主成分分析模型的隐私数据发布方法,及基于概率主成分分析和差分隐私的数据发布方法,利用主成分分析对高维数据降维,在低维数据中加入拉普拉斯噪声,然后再由概率主成分分析的生成模型生成数据集发布,使得发布的数据集满足差分隐私。经过分析与验证,当选取恰当的主成分个数时,2个真实数据集上的分类准确率较同类方法提高2%~5%。本文方法在支持向量机分类准确率方面可以保持良好的数据效用。  相似文献   

4.
传统的社交网络差分隐私保护方法由于直接对隐私数据进行了分类,导致方法的应用效果不佳。因此,设计一种基于生成对抗网络反馈的社交网络差分隐私保护方法。通过计算差分隐私的预算参数,构建差分隐私风险量化模型,对数据隐私泄露的风险量化。在生成对抗网络反馈的作用下,将隐私数据分类过程划分为数据分类和判别过程,通过计算隐私数据的信息熵,提高数据分类的精确度,实现社交网络差分隐私的保护。和以往的社交网络差分隐私保护方法相比,本文设计的基于生成对抗网络反馈的社交网络差分隐私保护方法的执行时间平均为123.2 ms,执行时间更短,应用效果更好。  相似文献   

5.
随着差分隐私研究及其应用的不断拓展,其在轨迹数据发布的隐私保护领域应用受到了广泛关注,现有研究方法大多采用Kmeans聚类方法对轨迹进行聚类划分,但由于差分隐私约束下的轨迹数据集受到噪声的扰动,导致现有的聚类方法无法保证最后的收敛效果。本文提出了一种基于方向控制的差分隐私保护轨迹数据发布方法。首先,提出了基于SKmeans||聚类的轨迹泛化算法,在聚类迭代过程中针对质心的更新,加入方向控制机制,设计指数机制中的打分函数控制质心的收敛,保证高维数据聚类的质量。其次,设计了一个基于有界阶梯噪声机制的轨迹数据发布算法,其中的有界阶梯噪声机制保证了在隐藏轨迹点真实计数的同时,提高了发布后轨迹数据的可用性。最后,通过实验验证了本文所提出方法的有效性。  相似文献   

6.
决策树算法是数据挖掘中重要的分类算法,但目前多数针对决策树的改进方法都基于传统的串行算法,不能满足大数据环境下对海量数据挖掘的需要.针对大数据集中串行挖掘算法效率低下的问题,采用MapReduce对决策树算法进行了并行化实现,同时引入修正参数来改进ID3算法倾向于多值属性选取的问题.实验结果表明,该算法具有较好的并行性和扩展性,能有效处理大数据集的分类问题.  相似文献   

7.
为提高差分隐私保护下推荐算法的准确性,提出了一种考虑差分隐私保护的基于Bhattacharyya系数(BC)的聚类推荐算法.以BC作为项目相似性度量的标准,根据BC相似性对项目进行K-medoids聚类,并在聚类簇中进行私有项目邻居选择.最后,根据最近邻居集信息,对用户的评分进行预测和Top-n推荐.提出的方案有效地克服了已有方法中存在的相似性度量依赖于共同评分的问题,提高了相似性度量的准确性,有效避免了因隐私保护而造成的最近邻居集质量下降的问题.理论分析和实验测试的结果表明,该方法在实现隐私保护的同时还能有效保证推荐的高质量,较好地实现了隐私保护和数据效用之间的平衡,具有良好的应用潜力.  相似文献   

8.
针对数据挖掘过程中隐私保护问题,本文提出一种面向聚类挖掘的个性化隐私保护算法。该算法界定了隐私度概念及其编码表示,并构造了由原始数据和隐私度共同描述的隐私数据模型。同时对隐私数据进行拓扑分类以获得隐私数据敏感性的线序集。该算法在原始数据、隐私度、元组敏感度、隐私线序集等视图上进行多视图聚类,结合可变k-匿名策略提出面向多视图聚类的满足个性化需求的隐私保护算法,以对不同聚类簇以及同簇内部元组施加程度有别的个性化保护操作。该算法在一定程度上降低了隐私数据在聚类挖掘过程中泄漏的风险。实验结果表明该算法具有较低的信息损失和较好的运行效率,实验验证了所提算法的可行性。  相似文献   

9.
基于DCGAN反馈的深度差分隐私保护方法   总被引:2,自引:0,他引:2  
为了防止攻击者在深度学习模型应用过程中利用生成式对抗网络(generative adversarial networks,GAN)等技术还原出训练集中的数据,保护训练数据集中用户的敏感信息,提出一个基于深度卷积生成式对抗网络(deep convolutional generative adversarial networks,DCGAN)反馈的深度差分隐私保护方法.该方法在深度网络参数优化计算时结合差分隐私理论添加噪声数据,基于差分隐私与高斯分布可组合特点,计算深度网络每一层的隐私预算,在随机梯度下降(stochastic gradient descent,SGD)计算中添加高斯噪声使之总体隐私预算最小;利用DCGAN生成数据选取可能得到的最优结果,通过对比攻击结果和原始数据之间的差别调节深度差分隐私模型参数,实现训练数据集可用性与隐私保护度的平衡.实验结果表明,该方法针对训练数据集中的敏感信息具有较高的隐私保护能力.  相似文献   

10.
针对密码算法识别工作中因密码算法数量增多、密文数据复杂化以及数据间干扰增加,导致单层识别方案的识别准确率和稳定性变差等问题,提出一种基于混合梯度提升决策树和逻辑回归模型,并基于该模型构造分组密码算法识别方案。在该方案中,首先用原始十组特征训练梯度提升决策树模型,然后利用其学习而生成的树来构造新特征,再将新特征做one-hot编码,最后把这些新特征加入到原有特征中,训练逻辑回归模型进行预测。在唯密文情况下,针对AES、3DES、Blowfish、CAST和RC2五种典型的分组密码开展密码算法识别研究。当密文大小及其它实验条件都相同时,其二分类的识别准确率最高可达70%,五分类准确率最高达32%;高于基于单一梯度提升决策树分类方案的52.5%和27.2%分类准确率,以及单一逻辑回归模型分类方案的45%和25.6%分类准确率;显著优于二分类50%以及五分类20%的随机猜测正确率。实验结果表明,在分组密码算法上开展二分类和五分类识别,相较于其它识别方案,当密文长度相同时,该方案具有更高的分类准确率。同时随着密文长度的变化,识别准确率呈波动性变化,该方案波动幅度最小,受影响程度最小,稳定性最高。  相似文献   

11.
SVM决策树能够较好地进行Web文本信息分类,在此基础上进一步结合遗传算法,将SVM决策树分类器的分类正确率作为GA适应度函数,对SVM决策树层次结构进行优化,在每一决策节点自动选择最优或近优的分类决策。实验结果表明,采用该方法进行多类分类,分类精度明显提高,体现了将遗传算法与SVM决策树结合的优越性。  相似文献   

12.
基于改进支持向量机的人手动作模式识别方法   总被引:1,自引:0,他引:1  
为了提高基于表面肌电信号(sEMG)控制的手部运动康复器对人手多种动作模式的识别率,比较常规支持向量机(SVM)多类分类器的特点,提出改进的决策树支持向量机多类分类方法.该方法引入基于sEMG特征向量的类间距离可分性测度来指导决策树的构建,能够为每个SVM子分类器的训练提供识别率较高的样本划分方案,在提高决策树内部节点分类成功率的同时,简化了分类器结构.通过实验对比可知,新方法在20种手部动作模式的识别训练过程中,单项动作最低识别率较常规决策树方式提高了7.1%,平均识别率达到88.9%,训练速度较一对一支持向量机分类器提高了5.8%.  相似文献   

13.
一种基于本体的并行网络流量分类方法   总被引:1,自引:0,他引:1  
海量网络流量数据的处理与单一节点的计算能力瓶颈这一矛盾导致数据分类效率低,无法满足现实需求。为解决这一问题,结合本体与MapReduce技术各自在海量异构数据描述与处理方面的优势,提出一种基于本体的并行网络流量分类方法。该方法基于MapReduce并行计算架构,根据网络流量本体结构,对网络流量本体并行化构建;通过并行知识推理完成基于流量统计特征的网络流量分类。实验结果表明,集群环境下基于MapReduce的网络流量本体构建效率明显高于单机环境,而且适当增加计算节点使得加速比线性提升;并行知识推理的分类方法能够有效地提高大规模网络流量的分类效率。  相似文献   

14.
以兰州市城关区EO-1 ALI图像作为基础数据源,对比LOOC与最邻近分类(NNC)方法提取不透水面的精度差异. LOOC方法对融合后EO-1 ALI图像进行LBV变换,将变换结果作为解译底图;设置4个尺度层次,分别对应水体、农用地、灌木林地、城市绿地和草地这5种主要背景类别,对解译底图执行4尺度面向对象分割;将上述类别对象的光谱特征和形态特征差异作为判别规则,利用决策树分类,将这5种背景类别依次从解译底图上提取、分离,生成不透水面初级提取图层;通过光谱反射率差异分析,选定EO-1 ALI图像的近红外波段8和中红外波段10作为分类特征,利用基于模糊C-均值(FCM)算法的非监督分类,从初级图层中分离出砂土、阴影这两种与高、低反照度不透水面光谱特征相近的类别,采用数学形态学开闭运算整饬图像,生成不透水面二级提取图层. 结合目视评判和总体精度、Kappa系数,定量分析LOOC方法与NNC方法的提取精度差异. 结果表明:LOOC方法提取不透水面的总体精度、Kappa系数分别为87.13%、0.830 3,较NNC方法分别提高5.91%、7.19%. LOOC方法依据各背景类别的遥感多特征知识,分两级将其分离出解译底图,从而间接、逐步逼近不透水面精准空间分布信息,辨识不透水面的效率优于NNC方法.  相似文献   

15.
为了更高效准确地检测到P2P数据流,将目前在数据挖掘等领域比较成熟的决策树分类技术应用到截包分析研究中.在实际应用中,通过对流的特征属性进行计算统计处理作为训练样本集建立决策树,并对建立的决策树进行剪技优化,实验表明决策树分类技术更能快速准确地定位P2P数据流,在实时处理大量数据方面更能体现决策树分类技术的效率与准确度.  相似文献   

16.
为解决现有基于网格结构的差分隐私二维空间数据划分发布方法可能引起局部划分过细导致查询精度低的问题,提出了基于kd-树的差分隐私二维空间数据划分发布方法-kd-PPDP算法(differentially privacy partitioning publication algorithm based on kd-tree)。算法采用了kd-树算法思想,通过启发式地识别网格化后数据分布情况并合并相邻近似网格单元来防止局部划分过细问题,从而减少所添加的噪声,提高查询精度。通过实验对比分析了kd-PPDP算法与现有基于网格结构的划分发布方法的查询误差以及时间效率,结果表明了该算法的有效性和可行性。  相似文献   

17.
本文在认真研究分析鸟类图像基础上,有效提取了鸟类图像的分类特征,并提出一种带先验信息的SVM决策树解决方案,该方案充分发挥了SVM和决策树的优点,简化了分类器的设计;并利用先验信息分类器分类效率高的优点,在一定程度上弥补了决策树错误累积的缺陷.实验表明,提取的特征简单有效,分类方案合理,获得了较好的分类识别率,实现了对闽江口15种鸟类的有效分类.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号