期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

张啸剑付聪聪孟小峰《中国图象图形学报》2020,25(4):655-668

目的人脸图像蕴含着丰富的个人敏感信息,直接发布可能会造成个人隐私泄露。为了保护人脸图像中的隐私信息,提出3种基于矩阵分解与差分隐私技术相结合的人脸图像发布算法,即LRA（low rank-based private facial image release algorithm）、SRA（SVD-based private facial image release algorithm）和ESRA（enhanced SVD-based private facial image release algorithm）。方法为了减少拉普拉斯机制带来的噪音误差,3种算法均将人脸图像作为实数域2维矩阵,充分利用矩阵低秩分解与奇异值分解技术压缩图像。在SRA和ESRA算法中,如何选择矩阵压缩参数r会直接制约由拉普拉斯机制引起的噪音误差以及由矩阵压缩导致的重构误差。SRA算法利用启发式设置参数r,然而r值增大导致过大的噪音误差,r值减小导致过大的重构误差。为了有效均衡这两种误差,ESRA算法引入一种基于指数机制的挑选参数r的方法,能够在不同的分解矩阵中挑选合理的矩阵尺寸来压缩人脸图像,然后利用拉普拉斯机制对挑选的矩阵添加相应的噪音,进而使整个处理过程满足ε-差分隐私。结果基于6种真实人脸图像数据集,采用支持向量机（support vector machine,SVM）分类技术与信息熵验证6种算法的正确性。从算法的准确率、召回率、F1-Score,以及信息熵度量结果显示,提出的LRA、SRA与ESRA算法均优于LAP（Laplace-based facial image protection）、LRM（low-rank mechanism）以及MM（matrix mechanism）算法,其中ESRA算法在Faces95数据集上的准确率和F1-Score分别是LRA、LRM和MM算法的40倍、20倍和1倍多。相对于其他5种算法,ESRA算法对数据集大的变化相对稳定,可用性最好。结论本文算法能够实现满足ε-差分隐私的敏感人脸图像发布,具有较好的可用性与鲁棒性,并且为灰度人脸图像的隐私保护提供了新的指导方法与思路,能有效用于社交平台和医疗系统等领域。相似文献

2.

基于序列格的隐私时序模式挖掘方法

下载免费PDF全文

彭慧丽金凯忠付聪聪付楠张啸剑《电子学报》2020,48(1):153-163

基于差分隐私的时间序列模式挖掘方法中,序列的最大长度以及添加拉普拉斯噪声的多少直接制约着挖掘结果的可用性.针对现有时间序列模式挖掘方法全局敏感度过高、挖掘结果可用性较低的不足问题,提出了一种基于序列格的差分隐私下时间序列模式挖掘方法PrivTSM（Differentially Private Time Series Pattern Mining）.该方法首先利用最长路径的策略对原始数据库进行截断处理;在此基础上,采用表连接操作生成满足差分隐私的序列格;结合序列格结构本身的特性,合理分配隐私预算,提高输出模式的可用性.理论分析表明PrivTSM方法满足ε-差分隐私,基于真实数据库上实验结果表明,PrivTSM方法的准确率TPR（True Postive Rate）和平均相对误差ARE（Average Relative Error）明显优于N-gram和Prefix-Hybrid方法. 相似文献

3.

基于差分隐私的轨迹模式挖掘算法

金凯忠彭慧丽张啸剑《计算机应用》2017,37(10):2938-2945

针对现有基于差分隐私的频繁轨迹模式挖掘算法全局敏感度过高、挖掘结果可用性较低的问题,提出一种基于前缀序列格和轨迹截断的差分隐私下频繁轨迹模式挖掘算法--LTPM。该算法首先利用自适应的方法获得最优截断长度,然后采用一种动态规划的策略对原始数据库进行截断处理,在此基础上,利用等价关系构建前缀序列格,并挖掘频繁轨迹模式。理论分析表明LTPM算法满足ε-差分隐私;实验结果表明,LTPM算法的准确率（TPR）和平均相对误差（ARE）明显优于N-gram和Prefix算法,能有效提高挖掘结果的可用性。相似文献

4.

基于随机游走的流形学习与可视化

邵超万春红张啸剑《数据采集与处理》2017,32(3):559-569

现有的全局流形学习算法都敏感于邻域大小这一难以高效选取的参数,它们都采用了基于欧氏距离的邻域图创建方法,从而使邻域图容易产生“短路”边。本文提出了一种基于随机游走模型的全局流形学习算法(Random walk-based isometric mapping,RW-ISOMAP)。和欧氏距离相比,由随机游走模型得到的通勤时间距离是由给定两点间的所有通路以概率为权组合而成的,不但鲁棒性更高,而且还能在一定程度上度量具有非线性几何结构的数据之间的相似性。因此采用通勤时间距离来创建邻域图的RW-ISOMAP算法将不再敏感于邻域大小参数,从而可以更容易地选取邻域大小参数,同时还具有更高的鲁棒性。最后的实验结果证实了该算法的有效性。相似文献

5.

面向人脸图像发布的差分隐私保护

下载免费PDF全文

张啸剑付聪聪孟小峰《中国图象图形学报》2018,23(9):1305-1315

目的由于人脸图像蕴含着丰富的个人敏感信息,直接发布出来可能会造成个人的隐私泄露。为了保护人脸图像中的隐私信息,本文提出了一种基于傅里叶变换与差分隐私技术相结合的人脸图像发布方法FIP（facial image publication）。方法将人脸图像作为实数域2维矩阵,充分利用离散傅里叶变换技术压缩图像。为了有效均衡由拉普拉斯机制引起的噪音误差以及由傅里叶变换导致的重构误差,引入一种基于指数机制的傅里叶系数选择方法EMK（exponential mechanism-based k coefficients sampling）,它能够在不同的系数空间中挑选出合理的傅里叶系数来压缩人脸图像,然后利用拉普拉斯机制对所挑选出的系数添加噪音,进而使整个处理过程满足ε-差分隐私。此外,为了避免较大的傅里叶系数空间导致指数机制挑选系数不准确问题,基于离散实数傅里叶变换的共轭对称特性,提出了一种增强的指数机制挑选傅里叶系数方法BEMK（boosted exponential mechanism-based k coefficients sampling）,该方法不仅进一步压缩离散傅里叶系数空间,而且还能够提高人脸图像发布的精度。结果基于4种真实人脸图像数据集采用支持向量机分类与采用主成分分析技术验证方法的正确性。从算法的准确率、召回率,以及F1-Score度量结果显示,提出的基于离散傅里叶变换技术的人脸图像发布方法均优于直接采用拉普拉斯机制的发布方法LAP（Laplace mechanism-based publication）。结论实验结果表明,本文方法能够实现满足ε-差分隐私的敏感人脸图像发布,图像分类验证其具有较高的可用性。特别是BEMK方法具有较好的鲁棒性,是一种有效的隐私人脸图像发布方法。相似文献

6.

基于自适应网格的隐私空间分割方法

张啸剑金凯忠孟小峰《计算机研究与发展》2018,55(6):1143-1156

基于网格与差分隐私保护的空间数据分割得到了研究者的广泛关注,空间数据的大小、数据的偏斜性以及拉普拉斯噪音的多少直接制约着空间分割的精度.针对现有基于网格分割方法难以有效兼顾大规模空间数据、数据偏斜性与噪音量的不足,提出了一种基于伯努利随机抽样技术的3层自适应网格分割(sampling-based three-layer adaptive grid decomposition, STAG)方法,该方法利用满足差分隐私的抽样技术抽取空间数据点作为分割对象.根据查询粒度的不同,首先在中间层利用指数机制与高通滤波过滤掉小于阈值的网格单元,然后利用Down-Split方法继续细分大于阈值的网格单元.对于那些小于阈值且连接的单元格,利用Up-Merge操作对这些单元进行最优化重组,形成粗粒度的网格单元.STAG与UG(uniform grid),AG(adaptive grid),Kd-Stand(kd-tree-based standard method),Kd-Hybrid(kd-tree-based hybrid method)在真实的大规模空间数据集上实验结果表明：其分割精度以及响应范围查询效果优于同类算法. 相似文献

7.

会话流中Top-k闭序列模式的挖掘

下载免费PDF全文

彭慧丽张啸剑《计算机工程》2009,35(19):86-87,9

在会话流中挖掘Top—k闭序列模式,存在因相关比率P的大小而导致的内存消耗和挖掘精度之间的冲突。基于False—Negative方法,提出Tstream算法,制定2种约束策略限制ρ。基于该策略设计加权调和计数函数,渐进计算每个模式的支持度。实验结果证明了该算法的有效性。相似文献

8.

IM-FTS:一种快速增量式频繁访问序列挖掘算法 总被引：1，自引：1，他引：0

下载免费PDF全文

彭慧丽张啸剑张亚东《计算机工程与应用》2009,45(3):138-140

由于Web数据增长迅速,先前的频繁序列随着序列库的更新而改变。若重新挖掘频繁序列会增加处理时间和数据存储量。提出一种改进的扩展格结构IE-LATTICE,存储先前的挖掘结果,并在其基础上提出一种基于双向约束的增量挖掘算法IM-FTS,在利用先前结果和约束策略前提下,算法仅从插入和删除序列中发现新的频繁序列。分析和实验表明算法能有效缩减数据处理时间和存储空间。相似文献

9.

基于本地差分隐私的键-值数据精确收集方法

张啸剑付楠孟小峰《计算机学报》2020,43(8):1479-1492

相似文献

10.

差分隐私下的一种频繁序列模式挖掘方法

卢国庆张啸剑丁丽萍李彦峰廖鑫《计算机研究与发展》2015,52(12):2789-2801

频繁序列模式挖掘是数据挖掘领域的1个基本问题,然而模式本身及其支持度计数都有可能泄露用户隐私信息.差分隐私(differential privacy, DP)作为一种新出现的隐私保护技术,定义了一个相当严格的攻击模型,通过添加噪音使数据失真达到隐私保护的目的.由于序列数据内在序列性和高维度的特点,给差分隐私应用于频繁序列模式挖掘带来了挑战.对此提出了一种基于交互式差分隐私保护框架的频繁序列模式挖掘算法Diff-FSPM(differential-privacy frequent sequential pattern mining).该算法利用指数机制获取最优序列长度,并采用一种维规约策略获得原始序列数据集的规约表示,有效降低序列维度的影响;应用前缀树压缩频繁序列模式,利用拉普拉斯机制产生的噪音扰动频繁模式的真实支持度计数,同时采用闭频繁序列模式和Markov假设,有效分配隐私预算,并利用一致性约束后置处理,增强输出模式的可用性.理论角度证明算法满足ε-差分隐私,实验结果验证算法具有较好的可用性. 相似文献