共查询到20条相似文献,搜索用时 468 毫秒
1.
2.
在群智感知系统中,从分布式数据源中持续收集和分析数据可以为先进的数据挖掘模型提供决策支持.由于数据中可能包含个人相关的信息,数据的采集和分析过程中通常伴随着隐私泄露的风险.本地化差分隐私作为先进的隐私保护方案可在用户的隐私性和数据的可用性之间提供较好的权衡.当前,键值数据作为异构类型数据,其同时含有分类数据和数值数据,基于本地化差分隐私在多维度下对键值数据进行关联分析面临着一定的挑战.针对隐私保护前提下键值数据的发布和关联分析问题,首先定义了键值数据的频率关联和均值关联问题,然后提出了适用于键值对的索引独热编码,为键值数据提供本地化差分隐私保护,最后在扰动的数据上对键值数据进行关联分析.基于仿真数据集和真实数据集的实验和理论分析验证了所提方案的有效性. 相似文献
3.
常规的数据聚类分析方法主要以设定阈值的方式分析,数据随机性较大,导致聚类分析效果不佳,故设计基于云计算技术的网络信息数据聚类分析方法。首先,提取网络信息数据的聚类特征,避免网络信息数据的随机性分析;其次,利用云计算技术处理网络数据,并构建网络信息数据聚类分析模型,进一步分析数据的有效性;最后,进行对比分析。实验结果表明,该方法的聚类分析效果更佳,具有较高的推广价值。 相似文献
4.
5.
6.
ETL作为BI/DW的核心和灵魂,是负责完成数据从数据源向目标数据仓库转化的过程,是实施银行数据仓库的重要步骤。为了确保数据的质量,在ETL过程当中会加上”数据清洗”功能。在数据清洗之前需要进行数据质量分析。以找出存在问题的数据。数据质量分析可以衡量前端分析所基于的数据的可信度,是分析结果正确的保证。本文分析了银行信用评估系统数据质量分析的方法以及数据质量分析的指导原则。 相似文献
7.
大数据时代,数据建设是信息化建设的核心,面对海量的业务数据,大型企业利用数据库管理系统对数据进行管理,采用专业的数据挖掘和分析工具对数据进行分析,从中提取有用的知识,并据此做出决策.对于数据量不够多又没有能力采购大型数据管理与分析软件的小型企业,利用Excel这一常用工具进行数据管理与分析,同样可以达到辅助决策的效果. 相似文献
8.
保障性分析记录是保障性分析过程产生的数据的记录,包括有关装备保障资源需求的详细数据。论文首先从理论研究方面人手,对国内外保障性分析数据管理方面的学术研究现状和军用标准研究现状进行论述,分析了国内外各软件系统在保障性分析数据管理方面的功能及其优劣,最后总结了进行保障性分析数据管理在装备保障性设计方面的优势和必要性。 相似文献
9.
为了实现对贵州卷烟销售大数据的分析及可视化,基于开源数据分析工具KETTLE构建了ETL过程模型,对现有的卷烟销售基础大数据进行抽取、转换、加载,形成分析型数据,快速高效地实现了数据集成.经过ETL处理的集成数据,为卷烟销售大数据可视化系统及进一步的数据挖掘、决策支持提供了数据基础.同时,采用GIS平台构建和可视化技术,设计并实现了卷烟销售大数据可视化分析系统,为企业的数据分析和决策支持提供了数据展示及分析平台. 相似文献
10.
基于数据仓库的JMS中数据管理方法的研究 总被引:1,自引:0,他引:1
在分析JMS数据管理的目标的基础上,重点研究了系统数据和用户数据的管理模型.对系统数据,重点研究了集群配置数据和日志数据的管理方法,提出使用OGSA的分布式消息结构来管理JMS中的分布式日志.对用户数据,研究了作业和作业网络及其实例的数据管理以及用户数据传输方法,提出了使用数据仓库来分析作业执行历史,设计了JMS的数据仓库模式,该模式能满足用户的多种查询和分析要求.有效地解决了JMS中的数据存储、查询、分析和共享等问题. 相似文献
11.
大数据时代下的智慧校园建设需要利用数字化校园建设积累的数据,进行智慧校园中的大数据分析。本文首先分析了大数据时代下各行业面临的机遇和挑战,然后分析了大数据时代下的智慧校园建设,最后给出了总结。 相似文献
12.
从大数据的概念进行认知,阐述分析大数据的生态圈,着重分析MapReduce对于大数据的应用及其优缺点,展望大数据的未来发展,期待更好地利用大数据,是大数据最终的价值体现。 相似文献
13.
遥感水文模型的输入和输出数据中含有大量的具有时间和空间序列的图像数据。通过可视化分析,可以找出这些数据中隐含的规律。目前遥感水文时空序列数据可视化分析的各个过程相互分离,分析效率比较低,因此基于IDL(Interactive Data Language,交互式数据语言)进行了遥感水文时空序列数据可视化分析系统的开发,并将其应用于EcoHAT(Ecohydrological Assessment Tools,生态水文评价系统)系统的数据分析。利用IDL强大的图像处理和数据计算能力,实现了遥感水文时空序列数据管理、图像显示和图表绘制等功能,使得海量遥感水文数据得到了更高效的利用。 相似文献
14.
数据聚合是无线传感器网络实现节能的一种重要技术。数据聚合的时机直接影响到数据聚合的准确度和延时,是数据聚合的关键问题之一。建立基于泊松过程的数据聚合模型,分析数据聚合时机的概率特征,提出满足一定概率要求和信息数要求的条件下,数据聚合时机的求解方法。仿真表明,理论分析和模拟实验结果基本相符。该结论为数据聚合时机的分析提供新的思路。 相似文献
15.
基于Hadoop和Mahout的大数据管理分析系统 总被引:1,自引:0,他引:1
随着数据量的爆炸性增长、数据结构的多样化和数据的流动性,传统的关系数据库系统已经无法满足大数据管理和分析的要求。因此有必要对基于大数据的数据管理和分析系统进行研究,以达到快速地统计和分析特定领域中海量结构化/非结构化数据,最终为决策提供支持的目的。提出一种基于Hadoop和Mahout的大数据管理分析系统。通过数据特性的分析,将数据分解后存入对应的数据库中进行管理。并在特定的应用领域中实现和验证了所提出的大数据管理分析系统,获得了优于已报道相关研究工作的数据分析结果。 相似文献
16.
17.
基于数据挖掘的考试分析系统数据预处理 总被引:1,自引:1,他引:0
数据预处理是为考试分析系统提供高质量数据的关键。为了更好地从大量复杂的和不确定的考试数据中有效地挖掘有用的信息,必须对源数据进行预处理。本文通过对考试分析系统中数据源进行详细的分析,发现数据源具有不一致、冗余等特点。从而给出了考试分析系统中数据预处理的一般性方法。 相似文献
18.
在机器学习应用中,由于数据来源渠道多以及部分标注者水平不足,训练数据质量很难得到保证.通过深度结合机器学习和可视化技术,可视分析技术将人融入数据质量分析与提升回路中,帮助提升训练数据质量,从而提高模型性能.文中首先总结了训练数据质量问题的三大类型:标注错,覆盖窄,标注缺;然后基于这些问题类型,介绍分析了相关的可视分析工作,包括标注错误修正方法,数据集偏离纠正方法和无标注数据质量提升方法;最后深入分析了基于可视分析的训练数据质量提升面临的机遇与挑战,包括在复杂任务、大语言模型、多模态数据、流数据等场景下的数据质量提升. 相似文献
19.
随着大数据时代的到来,学会运用数据,分析数据将是每个铁路管理者迫切需要掌握的能力。首先分析了铁路客票系统现状和客票数据采集和分析存在的问题,提出了客票数据采集和分析平台建设的解决方案;然后对客票数据和分析平台的设计原则和关键技术进行了详细介绍;最后给出了客票数据采集和分析平台的实现方法。 相似文献
20.
基因组数据隐私保护理论与方法综述 总被引:1,自引:0,他引:1
基因组数据已广泛应用于科学研究、医疗服务、法律与取证和直接面向消费者服务.基因组数据不但可以唯一标识个体,而且与遗传、健康、表型和血缘关系密切关联.此外,基因组数据具有不随时间而变化的稳定性.因此,基因组数据管理不当和滥用将会带来人类所担心的隐私泄露问题.针对此问题,除了相关法律法规的监管以外,隐私保护技术也被用于实现基因组数据的隐私保护.为此,本论文对基因组数据的隐私保护理论与方法进行综述研究.首先,本论文根据基因组测序到应用归纳基因组数据的生态系统,并依据基因组数据特点分析其存在的隐私泄露问题.其次,分类总结和对比分析基因组数据存在的隐私威胁,并陈述重识别风险与共享基因组数据的价值之间的均衡模型.再次,分类概述和对比分析量化基因组数据隐私和效用的度量.然后,分析基因组数据生态系统中测序与存储、共享与聚集及应用的隐私泄露威胁.同时,分类介绍和对比分析用于基因组数据的隐私保护方法.针对基因组数据生态系统中存在的隐私泄露问题,根据所使用的隐私保护方法,分类概括和对比分析目前基因组数据隐私保护的研究成果.最后,通过对比分析已有的基因组数据隐私保护方法,对基因组数据生态系统中基因隐私保护的未来研究挑战进行展望.该工作为解决基因组数据的隐私泄露问题提供基础,进而推动基因组数据隐私保护的研究. 相似文献