首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 90 毫秒
1.
数据挖掘原型系统GenMiner中分类挖掘模块的设计与实现   总被引:1,自引:0,他引:1  
吴湘洲  田盛丰 《计算机工程》2002,28(12):111-112,130
通用数据挖掘原型系统GenMiner中分类挖掘模块采用耗时短,分类效率高,较为成熟的决策树C4.5,介绍了该系统中分类挖掘模块的设计与实现,并说明了分类挖掘模块采用决策树C4.5的方法。  相似文献   

2.
Web日志挖掘是Web数据挖掘研究领域中一个最重要的应用方面。该文首先介绍了Web日志挖掘产生的背景,然后介绍了Web日志挖掘的基本概念,着重阐述了Web日志挖掘的预处理和日志挖掘算法两个关键技术,最后介绍了Web日志挖掘的应用,提出了其发展方向。  相似文献   

3.
数据预处理是为考试分析系统提供高质量数据的关键。为了更好地从大量复杂的和不确定的考试数据中有效地挖掘有用的信息,必须对源数据进行预处理。本文通过对考试分析系统中数据源进行详细的分析,发现数据源具有不一致、冗余等特点。从而给出了考试分析系统中数据预处理的一般性方法。  相似文献   

4.
一个面向电子商务的数据挖掘系统的设计与实现   总被引:8,自引:0,他引:8  
在分析电子商务给数据挖掘系统设计带来的新特点的基础上,提出了一个面向电子商务的数据挖掘系统的设计与实现方案,并实现了一个基于CORBA平台的原型系统。  相似文献   

5.
VisualDM:一个灵活的可视化数据挖掘系统   总被引:1,自引:0,他引:1       下载免费PDF全文
如果要建造一个健壮的数据挖掘系统,仅仅依靠挖掘算法是不够的。目前的挖掘算法还没有完全“智能”化,所以挖掘有用的信息常常不是很有效。不过可视化技术给了我们很大的帮助,我们将挖掘算法和可视化技术结合起来,从而实现了数据挖掘系统VisualDM。  相似文献   

6.
根据现代化教育的发展需要和现行网上考试系统存在的不足,给出了一种基于数据挖掘在线考试系统的设计方案、新的思路和方遣,并介绍了关键的实现技术和方法。  相似文献   

7.
基于Multi-agents系统的分布式数据挖掘   总被引:3,自引:0,他引:3  
计算机网络的发展以及海量数据的分布式存储,滋生了分布式数据挖掘(DDM)这一新的数据挖掘方式。本文针对多agent系统下的分布式数据挖掘进行了初步的研究,对agent方法用于DDM的优势、基于agents的分布式数据挖掘的问题,以及典型的基于agent的分布式数据挖掘系统和该领域的进一步研究方向作了一个概要的综述。  相似文献   

8.
根据现代化教育的发展需要和现行网上考试系统存在的不足,给出了一种基于数据挖掘在线考试系统的设计方案、新的思路和方法,并介绍了关键的实现技术和方法。  相似文献   

9.
一个开放数据挖掘系统的分析与设计   总被引:4,自引:0,他引:4  
采用数据挖掘标准研制挖掘系统正逐渐成为一种趋势。无论是对商业用户还是对系统开发者,这都具有非常重要的意义。对于用户,将大大减少在知识发现和模型配置过程中会遇到的困难,并从低运行成本和方便使用中获益;对于开发者,这些标准将影响着新一代挖掘系统的设计思想、挖掘算法与不同系统中数据的交互途径、异构环境中预测模型的配置方式。采用相关数据挖掘标准,笔者开发了一个开放数据挖掘原型系统XMiners。文章在简要分析了相关挖掘标准的基础上,给出了XMiners的系统结构设计和类模型设计。  相似文献   

10.
一种面向数据挖掘预处理过程的领域知识的分类及表示   总被引:6,自引:0,他引:6  
本文强调了领域知识应用于数据预处理过程的特点和意义,给出了面向数据预处理技术的领域知识的分类和表示,设计了面向数据预处理技术的领域知识的存储结构和将领域知识应用于数据预处理过程的算法.  相似文献   

11.
巨型数据库中的数据采掘   总被引:9,自引:3,他引:6  
罗可  吴杰 《计算机工程与应用》2001,37(20):88-91,100
数据采掘,也称数据库中的知识发现。传统进行数据分析的算法假设数据库中相关的记录比较少,然而,现在的许多数据库大到内存无法装下整个数据库,为了保证高效率,运用到大型数据库中的数据采掘技术必须是高度可缩放的。文章讨论了当今若干种先进的算法,它们能处理三类数据采掘:市场篮子分析、分类和聚类,并提出了今后的若干研究热点。  相似文献   

12.
张华  张有仁 《微型电脑应用》2001,17(11):33-36,27
本文介绍一个数据挖掘系统的设计思想和实现技术。该系统主要特点在于整个数据挖掘过程以任务为核心,协调系统中其他功能模块的运行。系统提供的句法制导图形编辑器集成了编辑、句法检查和解释执行的功能,以方便用户定义复杂的数据挖掘任务。系统的模型库按面向对象思想设计,采用COM技术实现,具有很好的可扩展性与灵活性。  相似文献   

13.
图像数据挖掘中的关联规则   总被引:9,自引:0,他引:9  
介绍了遥感图像数据的关联规则挖掘方法。对目前图像数据挖掘的研究及应用现状进行了综述。介绍了图像数据关联规则挖掘的最新进展,总结了图像数据关联规则挖掘的特点、类型及图像数据预处理的技术方法。  相似文献   

14.
数据挖掘管理系统   总被引:14,自引:0,他引:14  
林杰  薛华成 《微型电脑应用》2000,16(11):13-15,23
本文分析了数据挖掘的常用技术和分析方法,详细探讨了数据挖掘过程,在此基础上,设计了一个由多模型构成的数据挖掘管理系统的一般框架,其能支持数据挖掘分析的全过程。  相似文献   

15.
Web日志挖掘中数据预处理方法的研究   总被引:2,自引:0,他引:2  
Web日志挖掘是目前网上智能信息检索和电子商务的主要研究课题之一。而数据预处理在Web日志挖掘中起着很重要的作用,直接影响日志挖掘的质量和结果。介绍了Web日志挖掘数据预处理过程,综述了国际上的研究现状,及流行的处理方法。针对预处理步骤中的用户会话识别和路径填充进行了相应的改进。根据评估会话构造方法的标准,通过实验对给出的新方法与其他方法进行了分析比较。  相似文献   

16.
Web日志挖掘是目前网上智能信息检索和电子商务的主要研究课题之一。而数据预处理在Web日志挖掘中起着很重要的作用,直接影响日志挖掘的质量和结果。介绍了Web日志挖掘数据预处理过程,综述了国际上的研究现状,及流行的处理方法。针对预处理步骤中的用户会话识别和路径填充进行了相应的改进。根据评估会话构造方法的标准,通过实验对给出的新方法与其他方法进行了分析比较。  相似文献   

17.
面向大数据的海云数据系统关键技术研究   总被引:1,自引:0,他引:1  
由于数据产生成本的急速下降,人类社会产生的数据不仅以指数级别增长,而且数据的结构变得日趋复杂,使得传统的数据分析技术遇到了极大的挑战.如何对大量复杂数据进行分析和挖掘,从中提取有价值的知识用于决策,已经成为产业界和学术界的广泛关注问题,在一些国家已上升到国家战略层面.本文介绍了大数据的基本概念、特征和面临的科学问题,总结了中国科学院战略性先导科技专项“面向感知中国的新一代信息技术研究”中“海云数据系统关键技术研究与系统研制”课题的一些先期成果,为开发大数据管理、分析和挖掘系统提供一些参考依据.  相似文献   

18.
Data Mining in Large Databases Using Domain Generalization Graphs   总被引:5,自引:0,他引:5  
Attribute-oriented generalization summarizes the information in a relational database by repeatedly replacing specific attribute values with more general concepts according to user-defined concept hierarchies. We introduce domain generalization graphs for controlling the generalization of a set of attributes and show how they are constructed. We then present serial and parallel versions of the Multi-Attribute Generalization algorithm for traversing the generalization state space described by joining the domain generalization graphs for multiple attributes. Based upon a generate-and-test approach, the algorithm generates all possible summaries consistent with the domain generalization graphs. Our experimental results show that significant speedups are possible by partitioning path combinations from the DGGs across multiple processors. We also rank the interestingness of the resulting summaries using measures based upon variance and relative entropy. Our experimental results also show that these measures provide an effective basis for analyzing summary data generated from relational databases. Variance appears more useful because it tends to rank the less complex summaries (i.e., those with few attributes and/or tuples) as more interesting.  相似文献   

19.
本文对数据挖掘课程的特点以及应用领域、数据预处理方法以及关键的四项技术、Web挖掘与个性化推荐以及算法实现及应用上做了分析,并且在教学实践中做了尝试,提出了一些经验和不足。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号