首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
为了解决维度灾难所引起的隐私保护数据发布计算复杂度高、可用性低的问题,提出基于差分隐私采样机制和贝叶斯网络的DPSM-Bayes算法。利用贝叶斯网络模型,将高维联合概率分布转化为多个低维边缘概率分布,结合差分隐私采样机制和更适合高维概率分布加噪的IMLaplace机制,生成可用性更高的高维合成数据集。实验结果证明,在提供相同差分隐私保护的前提下,DPSM-Bayes算法能够有效地处理高维数据集的发布问题,与现有的方法相比发布的数据集具有更高的质量和可用性。  相似文献   

2.
由于入侵检测处理的多为高维数据,为了提高入侵检测的效率和准确率,提出了一种基于主成分分析(PCA)的特征提取方法,对数据源进行特征降维,将获得的主成分作为BP神经网络的输入进行数据识别.同时介绍了M atlab中相关函数,并与传统入侵检测方法进行了比较.实验结果表明:基于主成分分析的特征提取方法在简化BP神经网络规模的同时,显著提高了入侵检测识别效果.  相似文献   

3.
一种用于低维光谱空间构造的非负主成分分析法   总被引:3,自引:0,他引:3  
针对经典主成分分析法进行多光谱图像数据降维会使重构光谱反射比出现负值的问题,提出一种非负主成分分析法,并用该法构造低维光谱空间,实现高维多光谱数据与低维光谱空间的转换.首先分析主成分分析法产生非光谱反射比数据的原因,据此对主成分分析模型增加非负约束,建立迭代方程,求出一组线性无关的非负主成分权向量;然后用该组向量构造低维光谱空间;最后用非线性优化技术确定高维数据在低维空间中的投影值.实验表明,新方法与经典主成分分析法相比,能使重构光谱反射比数据限制在[0,1]范围内,保持了光谱反射比的物理意义,同时所构造低维光谱空间的精度能与经典主成分分析法保持一致.  相似文献   

4.
针对连续查询场景中用户实时位置的隐私保护问题,设计了一种基于客户端的假轨迹生成方法.该方法使用网格划分地理空间,统计网格划分后每个网格内的历史查询数据.通过分析网格内的历史查询数据构建实时预测用户移动轨迹的重力模型.在重力模型基础上结合历史查询概率定义了轨迹熵度量轨迹隐私保护等级,并在最大运行速度限制下,提出了一种具有最大轨迹熵的基于k-匿名的假轨迹隐私保护算法.实验结果验证了所设计的假轨迹生成方法能够有效地保护真实轨迹的隐私.  相似文献   

5.
提出了一种面向高维资源的分布式相似资源搜索机制.针对传统的分布式对等(P2P)网络无法解决高维资源的相似性搜索问题,通过基于主成分分析的降维算法将高维资源向量模型映射到低维空间,以低维空间中资源向量模型为索引,映射到P2P网络里的分布式散列表中,以一种完全基于P2P网络和路由机制的简单有效方式实现分布式相似性资源搜索,同时避免资源维数过高引发搜索的维数灾难.对降维处理后资源相似性信息保留情况进行了分析,并通过基于内容寻址网络的仿真验证了降维算法对于构建低维资源索引的有效性.对于具有一定聚类特征的高维资源,该方法可以在分布式的相似性搜索中获得较高的查准率.  相似文献   

6.
提出一种基于主分量分析和相融性度量的快速聚类方法。通过构造主分量空间将高维数据投影到两个主成分上进行特征提取,每一个主分量都是原始变量的线性组合,主分量之间互为正交关系,在剔除冗余信息的同时,实现高维数据降维,得到二维坐标,以此作为聚类分析的输入;提出相融性度量的定义,用相融性度量描述一个样本与训练集相融合的程度,设计一种基于相融性度量的分类器。以该方法为基础设计的光谱自动分类系统可实现快速、准确地分类。  相似文献   

7.
随着差分隐私研究及其应用的不断拓展,其在轨迹数据发布的隐私保护领域应用受到了广泛关注,现有研究方法大多采用Kmeans聚类方法对轨迹进行聚类划分,但由于差分隐私约束下的轨迹数据集受到噪声的扰动,导致现有的聚类方法无法保证最后的收敛效果。本文提出了一种基于方向控制的差分隐私保护轨迹数据发布方法。首先,提出了基于SKmeans||聚类的轨迹泛化算法,在聚类迭代过程中针对质心的更新,加入方向控制机制,设计指数机制中的打分函数控制质心的收敛,保证高维数据聚类的质量。其次,设计了一个基于有界阶梯噪声机制的轨迹数据发布算法,其中的有界阶梯噪声机制保证了在隐藏轨迹点真实计数的同时,提高了发布后轨迹数据的可用性。最后,通过实验验证了本文所提出方法的有效性。  相似文献   

8.
联邦学习这一类分布式机器学习技术旨在保证使用大数据进行机器学习训练时保护本地数据不泄露.然而一系列机器学习隐私攻击表明,即使不直接暴露本地数据,仅仅通过获取机器学习模型的参数就可以进行数据隐私的窃取.从训练时参与者和聚合端之间传递的中间模型到最后发布的聚合模型,联邦学习的模型发布过程存在诸多隐私威胁.由此出现了大量相关的保护技术,包括基于差分隐私以及基于密码学的联邦学习隐私保护技术.本文针对联邦学习本地模型和聚合模型发布过程中可能出现的各种隐私威胁和敌手模型进行了简要介绍,并且对相关的防御技术和研究成果进行系统性综述.同时也对相关技术在联邦学习隐私保护中的发展趋势进行了展望.  相似文献   

9.
时间序列降维及机场噪声中的机型识别   总被引:1,自引:0,他引:1  
为了提高非完整标记的高维机场噪声数据的处理速度和效率,研究了时间序列降维及机场噪声中的机型识别问题。首先采用概率类和不相关判别的半监督局部Fisher方法(SLFisher)得到降维转换矩阵,再将时间序列数据由高维空间映射到低维空间,最后在低维数据上进行k最近邻分类(kNN)。在国内某机场的实测噪声数据上的实验结果表明,SLFisher降维后机场噪声事件数据的机型识别效果取得显著提升。  相似文献   

10.
传统的社交网络差分隐私保护方法由于直接对隐私数据进行了分类,导致方法的应用效果不佳。因此,设计一种基于生成对抗网络反馈的社交网络差分隐私保护方法。通过计算差分隐私的预算参数,构建差分隐私风险量化模型,对数据隐私泄露的风险量化。在生成对抗网络反馈的作用下,将隐私数据分类过程划分为数据分类和判别过程,通过计算隐私数据的信息熵,提高数据分类的精确度,实现社交网络差分隐私的保护。和以往的社交网络差分隐私保护方法相比,本文设计的基于生成对抗网络反馈的社交网络差分隐私保护方法的执行时间平均为123.2 ms,执行时间更短,应用效果更好。  相似文献   

11.
针对轨迹隐私保护的个性化需求问题,提出一种基于典型相关分析的个性化轨迹隐私保护算法。算法对数据产生者认为不敏感的轨迹直接发布,而仅对数据产生者认为敏感的轨迹施以隐私保护操作。隐私保护过程中,先由不敏感轨迹和敏感轨迹获得二者的隐变量,再根据隐变量产生随机轨迹以替代敏感轨迹。该算法不仅能较好地尊重数据产生者的隐私保护意愿,而且能获得较高的轨迹质量。在真实轨迹数据上的实验结果验证了算法的有效性。  相似文献   

12.
基于流形学习的图像检索算法研究   总被引:1,自引:0,他引:1  
流形学习以发现非线性高维数据的本质维数为目标,使其更适合数据分析和高维数据的降维。图像检索中“语义鸿沟”问题指的是高维数据空间与低维的语义子空间之间的鸿沟,虽然利用相关反馈机制可以缩小这种鸿沟提高准确率,但是因为反馈图像数目较少,图像特征维数相对较高,会容易产生维数灾难问题。流形学习的引入为解决这一难题带来了新的希望,因为通过流形学习的方法学习高维图像特征数据的本征维数用于图像检索,大大提高了检索性能。基于流形学习的图像检索算法都是半监督的流形学习,充分利用了反馈信息,学习查询图像的语义子空间,有效的实现了高维数据的降维。  相似文献   

13.
基于主成分分析的密度聚类算法   总被引:1,自引:0,他引:1  
密度聚类算法可以描述任意形状的聚类,可以有效地处理异常数据,适合处理大数据集,但不适用于高维数据集的聚类,因此提出了基于主成分分析的密度聚类算法,将DBSCAN算法应用于PCA的k个主成分张成的子空间,解决了DBSCAN算法用于高维数据集的问题.运用气象数据进行实验,结果表明:主成分个数k值的选择严重影响聚类效果,故提出k的基本选择方法,正确选择k值情况下,该算法具有较好的聚类效果.  相似文献   

14.
智能网联汽车的高维轨迹数据被广泛用于从车辆的行驶轨迹中发现不同运动模式,从而降低交通风险、提高通行效率. 然而,数据利用过程中的隐私问题日益受到关注,如何在隐私保护的前提下进行算法的研究和应用是当前面临的一大挑战. 针对车辆轨迹数据分散在不同持有方且出于隐私保护无法共享数据的背景,利用差分隐私联邦学习框架来构建序列自编码网络提取轨迹序列的低维表示,并进一步利用轨迹的低维空间向量来发现不同时段下车辆的频繁路线. 提出的框架既通过本地训练避免了用户隐私数据的分享,又能通过高斯差分隐私机制防止模型信息的泄露. 该框架在真实的轨迹数据集上进行了验证,利用LSTM自编码作为嵌入学习网络,与非联邦、非差分加密的模型进行了对比分析,最后对三种得到的轨迹嵌入通过聚类分析发现该框架下学习的模型在充分尊重了隐私保护的前提下,仍然能够找出有效的频繁轨迹.  相似文献   

15.
主成分分析(PCA)在图像识别及高维数据降维中有着普遍的应用.为提升基于主成分分析的图像重建性能,在经典PCA算法的基础上提出了广义主成分分析(TPCA),并利用该算法进行图像重建.该算法利用图像像素的空间邻域构成固定尺寸的数组并将其作为广义标量进行代数运算,可以方便有效地描述各像素的空间约束,从而提升图像的重建效果,...  相似文献   

16.
K-匿名是数据发布应用场景下重要的隐私保护模型。近年来数据集K-匿名化的算法得到广泛的研究,Median Mondrian算法是目前唯一的多维K-匿名划分方法。文中研究了Median Mondrian算法,指出其不能有效地平衡数据划分精度与数据隐私安全性之间的矛盾,由此提出基于熵测度机制的多维K-匿名划分方法以及评估K-匿名化结果安全性的测量标准。实验表明该算法是可行的,能有效地提高数据安全性。  相似文献   

17.
基于Kubelka-Munk混色理论模型,对其光谱吸收散射比空间进行线性修正,对光谱反射率空间进行正态化处理,并在两种空间之间建立经验变换,之后利用非线性优化技术和主成分分析方法,得到一个保持打印基色光谱特性的低维空间,将光谱反射率数据变换至该空间,以实现针对彩色打印的多光谱数据降维。实验结果表明,新方法能使低维空间数据保持高维光谱空间数据的最主要信息,克服传统主成分分析法导致重建光谱超出光谱数据范围的缺陷。和主成分分析法相比,新方法的色度精度、光谱精度以及同色异谱指数三个评价指标都有提高。  相似文献   

18.
高维数据的“维数灾难”问题制约了机器学习、模式识别等诸多研究领域的发展研究。因此高维数据的降维方法,即将高维的特征数据化简投射到低维空间中,成为当前研究热点之一。稀疏自动编码器(Sparse Autoencoder)网络通过训练具有多隐含层的神经网络将高维数据进行降维,能有效地解决了高维数据由于维数过大导致的识别率低的问题。将网络用于手写体数字图像识别及人脸图像识别实验,取得了较好地识别结果,表明稀疏自动编码网络能有效地对高维数据降维。  相似文献   

19.
现有发布轨迹隐私保护方法没有考虑实际路网环境中轨迹的时空约束条件,不能对用户的轨迹隐私进行有效保护,导致轨迹隐私存在安全隐患.针对此问题,提出一种面向路网时空约束的轨迹隐私保护算法(TPPST),保护发布轨迹隐私安全.TPPST算法通过生成满足路网时空约束条件且与用户原始轨迹相似的假轨迹,将原始轨迹与假轨迹共同发布,从...  相似文献   

20.
在杭州某150 t/d的循环流化床垃圾焚烧炉上试验研究了焚烧炉运行参数与污染物排放之间的关系.采用主成分分析(PCA)方法研究了各运行参数对燃烧过程中污染物排放的贡献,实现了高维复杂数据的降维,并分析了多环芳烃和典型无机污染物之间的关联性.结果表明,用2个主成分就可以描述原有变量80%以上的信息,主成分1保留了与温度相关的大部分变量以及给水压力和汽包压力的信息,主成分2主要提供了给水温度、总风量和主蒸汽压力的信息.多环芳烃各同系物在尾部烟道的生成途径是相同的,CO和多环芳烃之间存在强烈的关联,而SO2和NOx与多环芳烃的关联不大.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号