共查询到20条相似文献,搜索用时 109 毫秒
1.
2.
邵明豪 《网络安全技术与应用》2009,(6):52-53,61
数据预处理将原始的真实数据库转换成适于数据挖掘的挖掘数据库,为挖掘算法更好的实现以及挖掘结果形象的显示打下了良好的基础。本文针对结构化数据讨论了数据预处理的两个目标:消除现实数据库中的数据缺陷;为数据挖掘做准备。 相似文献
3.
汉字编码的计算机实现的第一步工作就是原始数据的预处理。本文主要讨论了数据预处理所要实现的数据结构以及如何实现该数据结构,并对如何降低处理程序的时间及空间开销进行了探讨。 相似文献
4.
数据预处理中填补空缺值的方法技术 总被引:1,自引:0,他引:1
该文介绍了在实际工作中采用的几种方法数据预处理,对于有关方法,给出了算法和流程等,同时,给出了应用实例,并对相关方法的适用性进行了分析。 相似文献
5.
Web数据挖掘中的数据预处理 总被引:11,自引:0,他引:11
Web数据挖掘是分析网络应用的主要手段,其数据源一般是网络服务器日志,然而日志记录的是杂乱的,不完整的,不准确的并且是非结构化的数据,必须进行数据预处理。文章将预处理过程分为3个阶段-数据清洗、区分使用者,会话识别,并提出了一个高效的Web数据挖掘预处理结构WLP和相应的算法。 相似文献
6.
该文介绍了在实际工作中采用的几种方法数据预处理,对于有关方法,给出了算法和流程等,同时,给出了应用实例,并对相关方法的适用性进行了分析。 相似文献
7.
8.
数据挖掘中的数据预处理 总被引:34,自引:0,他引:34
1 引言数据挖掘(Data Mining,简称DM),也称为数据库中的知识发现KDD(Knowledge Discovery inDatabase),是近几年来随着数据库和人工智能发展起来的一门新兴的数据库技术。其处理对象是大量的日常业务数据,目的是为了从这些数据中抽取一些有价值的知识或信息。原始业务数据是知识和信息提取的源泉,对于数据挖掘就显得十分重要。目前所进行的关于数据挖掘的研究工作,大多着眼于数据挖掘算法的探讨,而忽视了对数据处理的研究。目前一些比较成 相似文献
9.
将数据挖掘技术应用于高速公路系统中,利用挖掘得到的模式对高速公路管理提供有效支持,数据预处理关系到收费数据的挖掘质量,针对丢卡、坏卡、回头车等存在的问题,对数据预处理进行了改正,并给予算法实现。 相似文献
10.
Web日志挖掘是目前网上智能信息检索和电子商务的主要研究课题之一。而数据预处理在Web日志挖掘中起着很重要的作用,直接影响日志挖掘的质量和结果。介绍了Web日志挖掘数据预处理过程,综述了国际上的研究现状,及流行的处理方法。针对预处理步骤中的用户会话识别和路径填充进行了相应的改进。根据评估会话构造方法的标准,通过实验对给出的新方法与其他方法进行了分析比较。 相似文献
11.
数据预处理在IT基础设施监控系统中的应用 总被引:1,自引:0,他引:1
数据质量的优劣对数据挖掘的成败有着举足轻重的影响,而作为数据挖掘过程第一步的数据预处理就是为了确保数据质量而设,其研究方兴未艾.从数据质量的概念出发,介绍了数据预处理的体系结构和常用方法,根据IT基础设置监控系统中的数据特点,探讨了数据预处理技术在该类数据上的典型应用. 相似文献
12.
Web日志挖掘中数据预处理技术的研究 总被引:2,自引:0,他引:2
在Web日志挖掘中数据预处理是整个挖掘过程的基础,由于客户端缓存的存在,在已往的预处理过程中都是通过路径补充技术得到用户完整的访问路径之后,才能进行事务识别.提出了一种只需根据网站的拓扑结构,不需要使用路径补充技术,由用户访问序列直接生成事务的算法. 相似文献
13.
14.
利用数据预处理技术,将脑卒中发病病例信息数据中的大量信息进行处理,去除了数据中的数据不一致、冗余、错误信息等,提高了数据质量,有助于筛选出相对可靠的数据,从而有利于得出真实、准确的数据分析结果. 相似文献
15.
大规模网络环境和大数据相关技术的发展对传统数据融合分析技术提出了新的挑战。针对目前多源数据融合分析过程灵活性差、处理效率低的问题,提出了一种基于相似连接的多源数据并行预处理方法,该方法采用了分治和并行的思想。首先,通过对多源数据中的相似语义进行统一、对个性语义进行保留的预处理方法提高了灵活性;其次,提出了一种改进的并行MapReduce框架,提高了相似连接的效率。实验结果表明,所提方法在保证数据完整性的基础上,使总的数据量减小了32%。与传统的MapReduce框架相比,改进后的框架在耗费时间方面减小了43.91%,因此该方法可以有效提高多源数据融合分析的效率。 相似文献
16.
数据预处理是为教学决策支持系统提供高质量数据的关键.教学决策的复杂性和不确定性以及教学数据的特殊性是制约教学数据预处理的主要问题.通过对教学数据预处理中的问题进行全面分析,设计了基于元数据的教学数据预处理方法.该方法主要包括数据的提取、集成和规约,不仅针对教学数据的特点改进了数据质量,而且根据教学活动中的主题对面向应用的教学数据进行了重新整合,从而适应不同教学决策任务的数据需求. 相似文献
17.
星载感应式磁力仪载荷可获取空间低频交流磁场,地面检测系统及数据预处理软件是设计开发的重要调试工具。首先介绍了感应式磁力仪的工作原理、探测数据产品及相应的研究意义。然后针对载荷设备外部接口设计了地面检测系统,实现了载荷与上位机的通信功能,并采用Visual C++调用Matlab的方法设计了一套具有实时科学数据显示的数据预处理软件,实现了在保持科学数据完整接收的同时以动态刷新方式显示不同方向和频段波形图的功能。该方法编程简单,集成功能全面,已经历了卫星多阶段的测试和试验。运行结果表明,该系统能够对仪器工作状态进行实时监视和控制,具有易维护和可拓展的特点,为星载仪器后续阶段的研制和应用提供了测试条件。 相似文献
18.
伴随着工业及社会信息化程度的增强,各个领域的自动化程度越来越高,大规模及超大规模海量数据应运而生,呈现出大数据特征。这些海量数据在提升行业发展动力的同时,也带来了巨大的挑战性问题—数据可用性。为了从海量数据中甄别出无用信息、挖掘有利于相关领域发展的有价值信息,就需要对其进行数据分析。数据预处理技术可以极大地减少数据分析时的处理量,提高数据分析处理的效率,而属性约简在数据预处理中是一个比较重要的环节。在分析大数据属性特征的基础上,较系统地分析了目前几种主流的属性约简算法,对各类算法的性能进行了剖析,并展望了今后大数据预处理的研究工作思路。 相似文献
19.
中药数据的不规范,使预处理成为数据挖掘系统中的一个重要过程。该文开发中药特性信息数据挖掘系统,介绍系统结构与挖掘流程,分析中药数据的特征,对数据进行预处理,包括过滤噪声数据、中医药术语规范化、缺损数据处理、剂量单位规范化、作用度规一化、功效量化等。 相似文献
20.
基于数据仓库的决策支持系统的设计与实现 总被引:2,自引:0,他引:2
在大型企业中,随着财务信息化建设的发展,积累了大量的财务数据.讨论了如何利用这些数据快速而正确地支持决策.在对数据仓库技术和决策支持系统研究的基础上,提出并实现了一种基于数据仓库技术的决策支持系统(DSS),内容包括系统体系结构、数据仓库模型,联机分析处理(OLAP)策略以及基于门户技术的个性化展示方式,并时系统的关键技术进行了阐述.该系统实现了将企业所掌握的数据转换为信息,进而转换成知识,提高企业决策能力,决策效率、决策准确性. 相似文献