共查询到20条相似文献,搜索用时 62 毫秒
1.
介绍了数据脱敏技术的相关信息,提出了利用BERT预训练语言模型结合Transformer编码器和条件随机场等人工智能技术处理文字、音频、图像、视频中敏感信息的方法,为解决数据安全和数据共享之间的矛盾提供了思路。 相似文献
2.
电力数据中包含一些隐私数据,一旦泄漏,就会对个人隐私安全造成隐患。为保证电力数据的安全性,提出了基于KL-散度设计电力用电数据自动脱敏算法。基于KL-散度算法建立敏感数据过滤模型,计算不同变量数据的KL距离,得到其相似性指标,对用户项目评分进行平滑处理,将具备相似性的敏感数据分成不同的批次。敏感数据去身份化处理,将数据匿名转换,计算用户真实路径被泄露的概率。设计数据自动脱敏算法,分别计算概念化数据、元组信息以及信息流的损失程度,以此判定脱敏后的数据是否可用。检验脱敏前后数据一致性,三类电力用电数据的变化率分别为0.43%、0.14%和0.11%,远远小于标准值。且算法在运行过程中单位时间处理数据量和平均延迟时间也较为理想,可见该脱敏算法具备实用性。 相似文献
3.
针对政务及金融等领域对于内部文件保密要求高,移动介质上存储的文件数据通过传统脱敏方法面临着数据内容量大、数据类型多样导致的脱敏效率低、脱敏内容不彻底等问题,提出了一种基于SM4与FF1结合的混合数据类型文件脱敏系统,该系统通过内容分割脱敏处理任意类型的数据,提升了文件脱敏的范围、准确性和效率;为了进一步减少脱敏系统代码运行的内存消耗,提出了汉字字典库索引转换算法,该算法通过构建待检测明文与汉字编码库的相对索引关系,优化传统脱敏系统中依赖于构建哈希表的键值映射;通过随机生成1000份测试文件进行脱敏测试,基于混合类型的文本不可识别率达到99.8%,脱敏以及内容复原的准确率达到99.9%;通过随机生成10份总大小约为10MB的测试文件,纯文本类型的脱敏速率平均可达2500字符/秒。 相似文献
4.
5.
随着全球数字经济的发展,数据安全问题日益凸显.在此背景下,数据脱敏逐渐成为数据安全治理的重要环节,是应对大数据环境下数据安全流转要求的重要技术,为保障敏感数据安全、发挥数据价值提供了一种有效方式.论文对数据脱敏及敏感数据概念的内涵、数据脱敏技术的实践应用及其规则、数据脱敏的类型及应用现状进行了分析与探讨,并指出了我国目... 相似文献
6.
7.
随着电力事业的蓬勃发展,产生的大量电力数据因具有数量庞大、类型繁多、不易于处理等特点,给信息安全带来了巨大风险。针对电力数据开放过程中会牵涉到部分隐私及机密不能直接开放的问题,通过分析主流脱敏算法建立敏感信息分级机制,提出了一种适应性强、可扩展性高的电力数据脱敏安全防护体系。该体系够满足复杂应用场景下的不同脱敏需求,在不破坏所需要的数据信息与数据特征的前提下,对敏感信息进行保护。首先,结合电力大数据中的敏感信息相应特征,对大数据进行初步的分类;然后,按照对敏感数据划分的唯一性原则对数据进行数据脱敏处理,依据数据资源的防泄漏保护层建立了一套以数据防泄漏为核心的数据脱敏安全防护体系。通过192组电力客户信息数据测试情况对所提方案进行验证,实验结果表明,所提方案实现了良好的脱敏效果,有效解决了电力大数据的应用与保护之间的矛盾。 相似文献
8.
基于生成对抗网络和差分隐私提出一种文本序列数据集脱敏模型,即差分隐私文本序列生成网络(DP-SeqGAN)。DP-SeqGAN通过生成对抗网络自动提取数据集的重要特征并生成与原数据分布接近的新数据集,基于差分隐私对模型做随机加扰以提高生成数据集的隐私性,并进一步降低鉴别器过拟合。DP-SeqGAN 具有直观通用性,无须对具体数据集设计针对性脱敏规则和对模型做适应性调整。实验表明,数据集经DP-SeqGAN脱敏后其隐私性和可用性明显提升,成员推断攻击成功率明显降低。 相似文献
9.
随着《中华人民共和国数据安全法》与2021年6月11日开始实施,信息化数据安全保护变得越来越重要。数据安全防护存在敏感数据量大、数据种类多样、攻击手段多样化等特点。基于DSM的数据脱敏系统通过静态脱敏,动态脱敏及风险评估管理的方式能够对数据传输过程中的数据进行脱敏,很好的解决了对业务系统中重要敏感数据的防护。 相似文献
10.
针对互联网形式下大数据剧增,敏感、隐私数据容易丢失的问题,提出一种大数据脱敏技术方案,构建出包含资源层、数据层、服务层以及应用层的B/S的管理架构,能够在用户进行信息交互时,保护用户的敏感隐私信息,并对大数据脱敏方法进行了介绍,本文设计的方案能够有效地不同数据库中的敏感数据识别出来,并针对营销数据库、人工智能数据库、门... 相似文献
11.
12.
13.
针对交通数据大吞吐量及时效性等特点,为了更高效地处理该类型数据,探索了一种基于云计算服务模式的、利用Hadoop技术架构可扩展的交通数据处理、发布、服务实现方法,并实现了原型系统。该方法的主要思想是利用Hadoop所提供的分布式文件处理能力对海量的交通数据进行并行处理,该过程效率较高,且运行可靠性强,与传统方法相比具有较为突出的优势。相关实验测试结果显示,该方法大大提高了该类型数据处理时效,取得了较为理想的实验效果,进一步论证了此方法对于处理该类数据的可靠性和有效性。 相似文献
14.
15.
首先指出多用户编辑下ArcSDE版本管理的优势,提出概念层、中间层和物理层的概念,指出版本、状态和表分别是这三个层次上的核心概念,并分别从各个层次上深入分析了ArcSDE版本管理机制的实现原理。然后提出了一种新的ArcSDE版本管理中多用户编辑后空间数据访问方法,阐述了其思想和具体实现算法,最后以试验证实了其可行性和实用性。 相似文献
16.
数字信号处理器(DSP)的高速运算性能使它在数字信号的处理上有着独一无二的优势,但是通常数字信号的数据量非常庞大,需要一种非常方便、高速的接口来实现与计算机的接插.而通用串行总线(USB)接口具有许多其它总线无法比拟的优点.在阐述系统硬件、软件实现方案的基础上,针对固件和驱动程序开发中的关键技术进行了深入的分析. 相似文献
17.
18.
基于RDBMS的XML数据管理技术研究 总被引:1,自引:0,他引:1
XML是一种专门为Internet所设计的标记语言,但是它已逐渐成为Internet上数据表示以及数据交换的标准,是一种发展势头良好的新兴数据管理手段.关系数据库管理系统(RDBMS)是一种技术成熟、应用十分广泛的系统.在数据管理上,XML技术和数据库技术各有优势和不足,XML和数据库结合技术成为学术界的研究热点.在对XML和数据库结合技术进行了研究的基础上一个基于RDBMS的XML数据管理的实现框架(XRM)被提出,该框架依据不同的映射策略,解析Schema文件或DTD,生成对应的关系模式,利用RDBMS存储中间件,使用户能透明地通过RDBMS来管理XML数据.该框架充分考虑了结构的灵活性和扩展性. 相似文献
19.
针对当前网络中加密流量的快速分类和准确识别的问题,提出了一种新的数据流特征提取方法.依据序列型数据特点和SSL握手协议规律,采用了端到端的一维卷积神经网络模型,并利用五元组来标记数据流;通过对数据流表示方式、数据包个数和特征字节长度的选择,更准确地定位了样本分类的关键字段位置,去除了对样本分类影响较小的特征,从而把原始... 相似文献