首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 343 毫秒
1.
聚类挖掘可以高效准确地从数据中找出很多潜在的、有价值的规律,但也同时存在着泄露用户隐私数据的安全威胁.已经有一些专门针对聚类挖掘的隐私保护研究,其中乘法扰动方法是一种准确性和安全性都较高的隐私保护算法.研究发现已知信息独立分量分析极大地降低了已有乘法扰动方法的安全性,它能够从乘法扰动数据中近似估计隐私数据.为了解决以上问题,提出了局部旋转扰动隐私保护算法,通过准确性分析得出新算法具有零损失准确性.利用安全性分析证明新算法能够有效抵御独立分量分析的攻击,具有更高的安全性.将新算法应用到聚类挖掘中,得到了与未加隐私保护的聚类挖掘非常接近的结果,说明了它的可行性.局部旋转扰动方法的出现,有效地解决了已有乘法扰动方法的安全漏洞,使得聚类挖掘能够更加安全地得到应用.  相似文献   

2.
KACA是一种基于局域泛化的K-匿名化方法.基于该算法,结合敏感属性隐私保护度,提出了一种S-KACA算法.该算法能够更有针对性地保护敏感隐私属性,而且使发布后数据的可用性较高,但由于其在保护敏感隐私信息时设置了一个隐私保护度的参数,会影响算法执行效率,使大规模的数据集应用有一定的局限性.为解决这个问题,引入一个高效的聚类算法——K-Prototypes算法,并将其与S-KACA算法相结合,提出一种K-Prototypes-SKACA算法.该算法首先通过聚类算法K-Prototypes将整个微数据集划分成几个较大的簇,然后再采用S-KACA算法对这些簇的微数据进行匿名化处理.实验验证K-Prototypes-S-KACA算法在隐私保护程度和数据可用性的大小与S-KACA算法相近,但是算法运行效率却得到了很大的提高.  相似文献   

3.
轨迹隐私保护中使用k-means算法进行聚类时,对初始值敏感,且聚簇数目的选择具有一定的盲目性,为解决该问题并提高聚类结果的可用性,提出一种结合k-shape和差分隐私的轨迹隐私保护方案KSDP(k-shape differential privacy).首先,对轨迹数据进行划分切割预处理,利用轨迹的时间属性和空间属性对轨迹切割划分,从而提高聚类泛化的质量.其次,使用设定的效用函数对预处理后的轨迹数据进行评判,并对过滤后数据进行聚类泛化操作.最后,在泛化后的数据中加入Laplace噪声,使其满足差分隐私保护模型,进一步保护轨迹隐私.实验仿真结果表明,与传统差分隐私k-means聚类方案对比,KSDP方案有效提高了聚类结果的可用性,并具有一定的性能优势,更好地实现了轨迹数据发布和隐私保护.  相似文献   

4.
随着差分隐私研究及其应用的不断拓展,其在轨迹数据发布的隐私保护领域应用受到了广泛关注,现有研究方法大多采用Kmeans聚类方法对轨迹进行聚类划分,但由于差分隐私约束下的轨迹数据集受到噪声的扰动,导致现有的聚类方法无法保证最后的收敛效果。本文提出了一种基于方向控制的差分隐私保护轨迹数据发布方法。首先,提出了基于SKmeans||聚类的轨迹泛化算法,在聚类迭代过程中针对质心的更新,加入方向控制机制,设计指数机制中的打分函数控制质心的收敛,保证高维数据聚类的质量。其次,设计了一个基于有界阶梯噪声机制的轨迹数据发布算法,其中的有界阶梯噪声机制保证了在隐藏轨迹点真实计数的同时,提高了发布后轨迹数据的可用性。最后,通过实验验证了本文所提出方法的有效性。  相似文献   

5.
针对C均值算法(C-means method,CM)对初值敏感、易陷入局部最优的问题,提出一种优化初值的C均值算法(Optimal initialization-based CM,OICM)。该算法首先计算数据集中每个点的邻域以及邻域密度,选择具有最大邻域密度的点作为第一个聚类中心;然后,从剩余的数据集中选择具有最大邻域密度、且其邻域与已有聚类中心的邻域的连接度满足一定条件的点作为下一个聚类中心,以此类推,直到确定了C个聚类中心;最后,利用C均值算法完成数据集的聚类分析。在仿真数据集和UCI数据集上进行聚类实验,结果表明OICM算法有效地克服了传统C均值算法对初值敏感的缺点,且性能优于其他3种典型的全局C均值算法。  相似文献   

6.
针对数据挖掘过程中隐私保护问题,本文提出一种面向聚类挖掘的个性化隐私保护算法。该算法界定了隐私度概念及其编码表示,并构造了由原始数据和隐私度共同描述的隐私数据模型。同时对隐私数据进行拓扑分类以获得隐私数据敏感性的线序集。该算法在原始数据、隐私度、元组敏感度、隐私线序集等视图上进行多视图聚类,结合可变k-匿名策略提出面向多视图聚类的满足个性化需求的隐私保护算法,以对不同聚类簇以及同簇内部元组施加程度有别的个性化保护操作。该算法在一定程度上降低了隐私数据在聚类挖掘过程中泄漏的风险。实验结果表明该算法具有较低的信息损失和较好的运行效率,实验验证了所提算法的可行性。  相似文献   

7.
针对密度峰值聚类算法在处理分布不均匀数据集时聚类性能不佳且不能自动确定聚类中心的问题,提出基于共享邻域的密度峰值聚类算法(DPC-SN)。首先,考虑数据点的局部邻域信息和数据点间的相关性,根据共享邻域重新定义局部密度;其次,给出了新的决策阈值作为区分聚类中心和非聚类中心的临界值,自动获取聚类中心;最后,在不同分布特征的合成数据集和UCI数据集进行实验验证。结果表明,该算法聚类精度和总体性能优于基于K近邻的密度峰值聚类(DPC-KNN)、原始密度峰值聚类(DPC)、K均值聚类(K-means)和基于密度的聚类(DBSCAN)4种算法。  相似文献   

8.
电动汽车频繁接入充电桩充电而产生的位置数据对优化充电桩布置、指导电力调度具有重要意义。然而充电位置数据对于汽车用户来说属于隐私信息。为防止汽车用户的隐私泄露,亟需探索研究隐私汇聚充电位置数据的方法。采用局部差分隐私技术保护电动汽车充电位置数据,通过引入贝叶斯随机多伪隐私算法设计一种基于分区的隐私保护充电位置数据汇聚方法。该方法利用贝叶斯随机多伪隐私算法设计了一个用于本地化扰动充电位置数据的局部混淆算法,然后,结合随机多伪算法的重构算法设计了满足稀疏、样本量小等特点的充电位置数据的隐私汇聚方法。同时,在保证隐私保护水平的前提下,通过对位置域进行划分以缩小隐私位置域,进一步提高汇聚结果的可用性。对所设计方法的隐私性进行分析。最后,在正态分布、均匀分布、峰值分布和随机分布4种不同的合成数据集以及公开的Gowalla数据集上进行验证。实验结果表明:在相同隐私水平的条件下,所设计的方法在可用性方面优于基于随机映射矩阵的隐私汇聚方法。  相似文献   

9.
为解决现有的分布式聚类算法效率低下和不能保护数据隐私的问题,在K-Dmeans算法的基础上,提出一种新的分布式聚类算法.该算法利用数据对象间的密度函数值来优化站点初始聚类中心,从而大大降低了聚类的迭代次数;同时各从站点只需向主站点传送其聚簇的特征信息,有效降低分布式聚类过程中的通信量,保护了各个站点的独立性,实验结果表...  相似文献   

10.
针对密度聚类算法无法应用于大规模数据集的问题,提出一种基于划分网格的密度聚类算法(GDSCAN)。将大规模二维点阵图划分为若干网格,网格最短边不小于给定邻域半径,目标点所在网格中任意点的邻域范围不会超过与该网格直接连接的网格,只需在保留网格内寻找邻域点,从而减少计算量;聚类从任意无类别核心点开始,将该点的所有密度可达组成一个簇,以此类推直至所有核心点都有类别;采用提出的GDSCAN算法对不同数量级的二维路网节点进行聚类验证。结果表明,GDSCAN算法可有效解决大规模二维点阵数据集中密度聚类的效率问题,数据量越大,效果越明显,且时间复杂度明显降低。  相似文献   

11.
本文研究了图的邻域复形同调群的性质。设G是一个简单连通图,X是G的一个顶点子集,F是G的一个边子集,可得G与G-X或者G-F是邻域同调的几个等价条件。  相似文献   

12.
现有典型的基于Tin的滤波算法只对本格网内的数据进行处理,没有考虑邻近地形的影响,使得滤波处理不能取得很好的效果。本文以待处理格网为中心,将待处理格网最低点与领域格网最低点构成三角网,再对格网内的数据与所在三角形的三个顶点进行比较,判断是否符合阈值来确定是否为地面点。实验的结果表明对改进后的三角网迭代的算法大大改善了滤波效果,提高了滤波处理结果的准确性。  相似文献   

13.
为了提高并行节约算法的运算效率,需要运用合理的邻域选择策略和数据结构来降低算法的空间和时间复杂度。以车辆路径问题(vehicle routing problem, VRP)的数据规模和客户点的分布情况为切入点,综合考虑客户点的邻域范围与距离、规模、分布情况的关系,提出一种基于自适应思想的邻域选择策略,提高邻域选择的合理性,通过进一步优化数据存储结构降低存储空间。多组仿真测试证实,与其他邻域选择策略相比,自适应策略可以在保证运算质量的前提下,大幅度提高节约算法的运算速度,降低存储空间,且针对客户点较为集中的VRP具有明显的优势,其中rl5915表现最为突出,运算时间只需要其他邻域选择策略的50%左右。理论研究和实验结果证实自适应邻域选择策略可以有效提高节约算法的运算速率。  相似文献   

14.
为了有效地实现对人脸的识别,先用线性判断分析(LDA)方法将原始的人脸数据降维,利用降维后的数据选取点的k近邻,进而提出度量优化的保持邻域嵌入算法(MONPE)。MONPE算法:一方面,通过LDA降低原始数据的维数,使得欧氏度量的应用成为合理。另一方面,通过LDA拉近了类内点的距离,拉大了类间点的距离,使得某个采样的近...  相似文献   

15.
泛圈图长期以来都是图论中较受重视的课题 ,图论专家Bondy在文献 [1]中得到条件d(x) d(y)≥n的泛圈性结果 ,本文进一步得到条件NC≥n-δ下泛圈性的相同结果 ,本文的结果也把Fandree等的文献[2 ]的结果从哈密尔顿图推进到泛圈性 .  相似文献   

16.
文章给出了几种类型局部可数紧空间和几种类型局部可数仿紧空间的概念,讨论了它们的一些性质,给出可数仿紧空间的每一闭子集都是可数仿紧的;若拓扑空间X是邻域开包局部可数仿紧空间,A是X中任一开集,则A是邻域开包局部可数仿紧子空间等一些有益的结果。  相似文献   

17.
提出一种基于全局距离和类别信息的邻域保持嵌入算法。该方法在使用欧氏距离构造邻域图中,加入表征全局距离的全局因子和表示类别信息的函数项,全局因子可以使分布不均匀的样本变得平滑均匀,类别信息可以使同类样本点紧凑异类样本点疏离,通过提高所选邻近点的质量,优化数据的局部邻域,使降维后的数据具有更好的可分性。试验结果表明,该算法具有较高的准确率,优于传统的邻域保持嵌入算法。  相似文献   

18.
一种用于人脸识别的正交邻域保护嵌入算法   总被引:1,自引:0,他引:1  
在邻域保护嵌入算法的基础上,提出了一种新的降维方法——正交邻域保护嵌入算法.首先,从最优投影的概念出发,定义了一种反映投影向量的邻域结构保护能力的函数;然后以邻域保护函数为目标函数,在原始的优化问题中增加正交约束条件,推导得到一组具有正交性的最优投影向量的迭代公式.与邻域保护嵌入算法相比,得到的正交向量具有更好的邻域保护性能,从而带来更强的判别能力,降低了误差率.在标准人脸库上的实验结果表明,与其他降维方法相比,新算法的最低误差率可减小15%~20%,且在选取的特征维数较低时就可获得最优值.  相似文献   

19.
记G=(V,E)表示简单图,NC=min{|N(x)∪N(y)|:x,y∈V(G),xy∈E(G)},NC2=min{|N(x)∪N(y)1:x,y∈V(G),d(x,y)=2}。1989年Faudree等4个美国著名图论专家研究课题NC≥(2n 1)/3的哈密尔顿连通图,得到:若3连通n阶图G,NC≥(2n 1)/3,则G是哈密尔顿连通图。本文进一步研究NC2≥(2n 1)/3的哈密尔顿连通图,得到界为最好的结果:若3连通n阶通图G,NC2≥(2n 1)/3,则G是哈密尔领连通图。而且本文的证明极其简捷。  相似文献   

20.
该文分析了常规图像滤波算法的局限性,并在此基础上提出了一种基于邻域信息的自适应滤波新算法。该算法利用噪声的灰度不一致性,通过邻域信息差分值的差异来决定象素的类别,然后针对不同类别的象素点采取不同的滤波算法。实验结果表明,该算法能够显著提高图像的信噪比。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号