首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 104 毫秒
1.
随着移动医疗的飞速发展,医疗机构在共享个人医疗数据的同时也存在着隐私泄漏的隐患。基于k-匿名和l-多样性模型,提出利用个性化熵l-多样性隐私保护模型来细粒度地保护用户的隐私,通过区分强弱敏感属性值来提高对敏感属性的约束,降低敏感信息及强信息的泄漏概率,从而达到医疗数据共享安全。通过数据分析及实验结果表明,该方法在提高数据精度的同时可以减少执行时间,而且能提高服务质量,比既有的方案更有效。  相似文献   

2.
《软件工程师》2017,(12):12-15
随着移动定位技术的发展,大量移动轨迹数据使信息泄露于公开的互联空间中,使攻击者可以通过计算推理挖掘轨迹信息。轨迹数据发布的隐私保护是近年来网络空间安全领域研究的热点问题。为了防止该类轨迹数据隐私的泄露,通常采用k-匿名技术实现轨迹的隐私保护。该技术在国内外研究中取得了一定的成果。本文阐述了轨迹隐私保护的相关定义及研究方法,对国内外移动轨迹数据k-匿名隐私保护研究的成果进行了总结,并介绍了国内外有关轨迹数据k-匿名隐私保护研究的相关技术。同时对国内外的技术进行了比较,详细叙述了国外与国内各自方法的优点,指出了研究中存在的不足与今后研究的大致方向。  相似文献   

3.
传统的数据发布隐私保护研究假设数据发布者持有的电子化数据是原始的、未经过处理的数据.k-匿名模型提出之后,许多匿名化模型主要针对敏感属性提出了各种约束.然而,隐私保护中另一个重要原则是个人的隐私自治.实际应用场景中,个人有选择和决定隐私约束的权利.用户所提供的数据很可能是不完整的或预先经过处理的.围绕非敏感属性上的约束条件定义了一种新颖的匿名化模型:基于个人隐私约束的k-匿名;并设计了一种自上而下的启发式匿名化算法.实验表明,该算法能很好地处理基于个人隐私约束的k-匿名问题,并具有较少的信息损失.  相似文献   

4.
兰丽辉  鞠时光  金华 《计算机科学》2011,38(11):156-160
由于科学研究和数据共享等需要,应该发布社会网络数据。但直接发布社会网络数据会侵害个体隐私,在发布数据的同时要进行隐私保护。针对将邻域信息作为背景知识的攻击者进行目标节点识别攻击的场景提出了基于k-匿名发布的隐私保护方案。根据个体的隐私保护要求设立不同的隐私保护级别,以最大程度地共享数据,提高数据的有效性。设计实现了匿名发布的KNP算法,并在数据集上进行了验证,实验结果表明该算法能够有效抵御部域攻击。  相似文献   

5.
k-匿名隐私保护模型中,k取值同时影响着k-匿名表的隐私保护程度和数据质量,因此,如何选择k值以达到隐私保护和数据质量的共赢具有重要意义.在对k取值和隐私保护、数据质量关系分析和证明的基础上,根据不同情况下的k-匿名表隐私泄露概率公式,对满足隐私保护要求的k取值范围进行了分析;根据k-匿名表的数据质量公式对满足数据质量要求的k取值范围进行了分析.根据满足隐私保护和数据质量要求的k取值之间的关系,给出了k值的优化选择算法.  相似文献   

6.
由于移动网络低安全等特性,导致移动数据库中与用户隐私相关的字段处在一种可能会被披露的状态,如何实现高效可靠地隐私保护是当前移动数据库中一个主要的研究方向。其中k-匿名技术已被证明是一种可靠地数据查询发布技术,在文中,我们在移动数据库引入k-匿名技术从而对数据库中用户的相关数据或敏感数据进行保护,以防止具有知识背景下的隐私披露。实验证明具有一定的有效性,时间复杂度也在可控的O(k)级别,比较高效。  相似文献   

7.
数据发布中的匿名化技术研究综述   总被引:5,自引:0,他引:5  
匿名化技术被公认为是解决隐私信息泄漏问题的一个好方法。当前匿名化技术的研究工作大致可以分为匿名策略的研究和匿名实现技术研究两类。分别介绍了这两类研究近年来的主要成果,并对其进行了比较,对其中尚未解决的问题进行了客观的分析。  相似文献   

8.
隐私保护数据挖掘(PPDM)利用匿名化等方法使数据所有者在不泄露隐私信息的前提下,安全发布在数据挖掘中有效可用的数据集。k-匿名算法作为PPDM研究使用最广泛的算法之一,具有计算开销低、数据形变小、能抵御链接攻击等优点,但是在一些k-匿名算法研究中使用的数据可用性评估模型的权重设置不合理,导致算法选择的最优匿名数据集在后续的分类问题中分类准确率较低。提出一种使用互信息计算权重的互信息损失(MI Loss)评估模型。互信息反映变量间的关联关系,MI Loss评估模型根据准标识符和标签之间的互信息计算权重,并通过Loss公式得到各个准标识符的信息损失,将加权后的准标识符信息损失的和作为数据集的信息损失,以弥补评估模型的缺陷。实验结果证明,运用MI Loss评估模型指导k-匿名算法能够明显降低匿名数据集在后续分类中的可用性丢失,相较于Loss模型和Entropy Loss模型,该模型分类准确率提升了0.73%~3.00%。  相似文献   

9.
针对现有的匿名方案往往较少考虑离群数据的敏感问题以及信息损失与时间效率的最优化问题,提出一种基于约束聚类的k-匿名隐私保护方法.通过K近邻思想划分初始集群,根据设定的阈值δ将集群进行重新划分,划分过程始终遵循信息损失最小化原则,得到每个等价类元组数都在k与2k之间,过程中分类考察准标识符属性并充分考虑离群点对聚类结果的...  相似文献   

10.
基于聚类的k-匿名机制是共享数据脱敏的主要方法,它能有效防范针对隐私信息的背景攻击和链接攻击。然而,现有方案都是通过寻找最优k-等价集来平衡隐私性与可用性.从全局看,k-等价集并不一定是满足k-匿名的最优等价集,隐私机制的可用性最优化问题仍然未得到解决.针对上述问题,提出一种基于最优聚类的k-匿名隐私保护机制.通过建立数据距离与信息损失间的函数关系,将k-匿名机制的最优化问题转化为数据集的最优聚类问题;然后利用贪婪算法和二分机制,寻找满足k-匿名约束条件的最优聚类,从而实现k-匿名模型的可用性最优化;最后给出了问题求解的理论证明和实验分析.实验结果表明该机制能最大程度减少聚类匿名的信息损失,并且在运行时间方面是可行有效的.  相似文献   

11.
计算机可理解的统一信息模型是基于语义的医学影像检索研究的数据基础. 讨论了医学影像及其相关信息使用中存在的数据异构、图像标注术语及语法不一致及数据格式不支持现有数据挖掘和图像语义检索的问题, 提出了一种基于本体的医学影像信息集成方案. 在分析医学影像信息来源及其关系基础上, 结合领域专家知识, 使用斯坦福大学提出的本体构建“七步法”设计了医学影像信息本体模型, 实现了本体模型的持久化、原始数据提取和数据整合, 解决了医学影像信息使用中存在的问题, 该信息模型已用于医学影像检索系统中.  相似文献   

12.
万涛  刘国华 《计算机工程》2012,38(20):38-10
k-匿名隐私保护模型在隐私保护过程中会产生大量k-匿名数据.为研究k-匿名数据中的数据依赖问题,提出一种扩展函数依赖,将经典函数依赖中的被决定属性取值相等这个条件进行扩展,使其取值来自于同一个指定集合.应用结果表明,该扩展函数依赖不仅包括经典函数依赖、垂直函数依赖、水平函数依赖、度量函数依赖的特性,而且可以从数据完整性的角度描述k-匿名数据的约束条件及指导k-匿名隐私保护模型中准标识符的选取.  相似文献   

13.
针对很多单位网站运营维护复杂繁琐,阻碍信息发布和更新的问题,提出信息发布软件系统模型。该模型基于ASP.NET技术,以信息发布的正确性和及时性为目的,按照模块化设计理念,动态生成信息发布网页,把信息的更新工作简化到只需录入文字和图片,从而减轻网站维护的工作量。对此模型的压力测试表明,该系统模型设计合理,系统稳定性良好。   相似文献   

14.
面向多敏感属性医疗数据发布的隐私保护技术   总被引:1,自引:0,他引:1  
金华  刘善成  鞠时光 《计算机科学》2011,38(12):171-177
针对目前多敏感属性医疗数据发布问题,在分析多维桶分组技术的基础上,继承了有损连接对隐私数据进行保护的思想,提出了一种基于相同敏感属性集的L-覆盖性聚类分组方法。首先计算每条记录的相同敏感属性集,然后按照聚类的思想将满足L-覆盖性的记录进行分组。同时给出了L-覆盖性聚类分组的实现算法(LCCU)。实际数据集上的大量实验结果表明,该方法可以有效防止隐私泄露,同时增强数据的可用性。  相似文献   

15.
医疗数据发布中属性顺序敏感的隐私保护方法   总被引:2,自引:1,他引:1  
高爱强  刁麓弘 《软件学报》2009,20(Z1):314-320
隐私保护已成为包含微数据应用诸如医疗数据发布共享或数据挖掘中的一个重要问题.基于全局重编码或局部重编码的匿名性方法,通过保证每一条数据记录都至少有某个数量的其他记录与其具有同样的特征来保护隐私性.如果考虑到对处理后的数据进行属性顺序敏感的数据分析任务,这类方法并不能很好地完成任务.研究基于数据可用性指标的匿名性方法,着重考虑数据分析任务中的属性顺序对于匿名性方法的影响.从多维数据匿名的概念出发,讨论用于该类情况下的数据匿名性方法.在公开数据集上的实验结果表明,该方法对于上述问题是有效的,并且效率并未受到影响.  相似文献   

16.
科学数据出版是推动和深化数据共享的有效手段。本文提出一种科学数据出版模式——数据中心联合传统学术期刊的科学数据出版。该模式通过数据中心与传统学术期刊的合作以数据论文的形式实现数据的正式出版,其中通过数据中心实现数据的永久存储与管理,并开展数据挖掘与共享,数据论文则经过严格的同行评议发表在传统期刊上。该模式不但能够提升数据质量,而且有助于数据成果被现有的科研成果评价体系所接受,激发数据作者出版、共享数据的积极性,有效解决数据共享长期面临的数据质量控制和数据作者权益保护两个关键问题,进而达到整合优质数据资源、深化数据再利用的效果,实现科学数据共享可持续发展。这种出版模式结合了数据中心和学术期刊各自的优势,组织形式灵活,具有易操作可重复的特点,也可供地学以外其他学科借鉴。  相似文献   

17.
针对医疗保险信息化建设中大数据应用技术的不足,本研究以苏州工业园区医疗保险特病结算数据为分析对象,通过大数据算法对医疗保险信息化建设中的大数据进行梳理、分析、清洗、重构等,然后构建移动平均、指数平均模型实现对大数据的处理。本研究还通过随机矩阵理论算法实现医疗数据的能谱和本征态分析、统计,得出实际测量中的随机程度,揭示出医疗保险信息化建设大数据包含的整体关联事件特征,又利用数据挖掘算法再次对分析出的数据进行二次处理,使用户快速从海量的数据(比如尿毒症、白内障、再生障碍性贫血、血友病、恶性肿瘤康复期、冠心病合并心肌梗死、癫痫)中需求目标数据,实现对数据的分类、分析。实现数据表明,本研究方法具有明显的实用价值,为医保基金的可持续发展及医疗保险政策的制定、完善提供技术参考。  相似文献   

18.
随着信息技术的发展,医疗数据发布中的隐私保护技术一直是数据隐私研究的热点,医疗数据发布的同步更新是其中一个重要问题。为解决医疗数据匿名发布的同步问题,提出了一种建立在(α,k)-匿名数据基础上的支持数据动态更新的算法——(α,k)-UPDATE。该算法通过对语义贴近度的计算,在(α,k)-匿名数据集中选择最贴近的等价类,再进行相应的更新操作。更新后的匿名数据集满足(α,k)-匿名约束,可有效地保护患者的隐私信息。实验结果表明,该算法能在实际环境中稳定、有效地运行,在满足医疗数据实时一致性的同时,具有运算时间短、信息损失度小的优点。  相似文献   

19.
医学数据挖掘中的数据预处理与Apriori算法改进   总被引:2,自引:0,他引:2  
医学数据挖掘是提高医院信息管理水平,为疾病的诊断和治疗提供科学的、准确的决策的需要。分析了医疗数据的特点,并以慢肺阻疾病诊断的数据集为例,阐述了把医疗数据转换成事务数据格式的方法,描述了关联规则挖掘在医疗数据分析中应用所遇到的难题,针对这些难题给出了一些算法的改进措施,并用数据进行测试。结果表明,此算法优于原来算法,它可以减少产生的规则的数量,从而能快速发现有趣的医疗关联规则。  相似文献   

20.
The COSTAR system keeps medical records and does accounting and administrative tasks for group practices. It also offers clinical researchers a useful query language for manipulating medical data.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号