首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
数据库中知识发现的处理过程模型的研究   总被引:6,自引:1,他引:5  
1 前言数据库中的知识发现KDD(Knowledge Discov-ery in Database)是近年来随着数据库和人工智能技术的发展而出现的,它是从大量数据中提取出可信的、新颖的、有效的并能被人理解的模式的高级处理过程。它主要采用机器学习算法或统计方法进行知识学习,一般将KDD中进行知识学习的阶段称为数据挖掘(Data Mining)。数据挖掘是KDD中的一个非常重要的处理步骤。人们往往不加区分地使用两者。一般来说,在工程应用领域多称数据挖掘,而在研究领域人们则多称为数据库中的知识发现。人们进行的关于KDD的研究是为了将知识发现的研究成果应用于实际数据处理中,为科学的决策提供支持。正是因为这样,目前所进行的关于  相似文献   

2.
在KDD和Data Mining 中我们的部分工作和看法   总被引:1,自引:0,他引:1  
本文介绍了什么是KDD和Data Mining,目前国 外在Data Mining中研究的一部分重要内容的概况以及几年来我们在KDD和Data Mining中的 部分工作和看法.  相似文献   

3.
数据挖掘与知识发现综述   总被引:23,自引:0,他引:23  
数据挖掘与知识发现是目前一种新的重要的研究领域。介绍了数据挖掘与知识发现的概念、功能、常用方法、数据挖掘过程及其广泛应用 ,阐述了数据挖掘技术的未来发展方向。  相似文献   

4.
一种基于遗传算法的知识挖掘算法   总被引:14,自引:0,他引:14  
数据挖掘是近年来数据库领域中出现的一个新兴研究热点。传统的数据挖掘是从大量数据中获取知识。该文基于遗传算法提出了一种新的知识获取方法-GAKDK,通过对知识树的交叉交异操作,从现有规则中获取未发现的知识。  相似文献   

5.
基于Rough Set的数据预处理   总被引:2,自引:0,他引:2  
RoughSet理论是一种新的处理不精确,不完全与不相容知识的数学工具。数据预处理是数据挖掘中必不可少的步骤,处理的结果对下一步数据挖掘有直接影响。论文利用RoughSet一些特性对KDD99中的数据集进行处理,并且针对数据集的特点实现了对其进行数据离散化、属性约简等处理。通过这些处理过程为下一步的数据挖掘打下了基础。  相似文献   

6.
数据挖掘工具DMTools的设计与实现   总被引:3,自引:0,他引:3       下载免费PDF全文
介绍了一个通用的数据工具DMTools。它实现了基于数据库的知识发现的主要过程,可视分析,数据预处理,数据库的知识发现,数据挖掘,模型解释及模型评估算。主要介绍了这个系统的体系结构和各愉的功能。使用本工具。可从各行业的历史业务数据库中挖掘出隐含的有价值的知识,用于决策支持。  相似文献   

7.
文章介绍了数据采掘技术的定义、数据采掘的过程和主要技术手段以及空间数据仓库的定义、基本结构框架、处理流程和技术支持,分析了基于空间数据仓库的数据采掘特点.  相似文献   

8.
9.
基于Agent的知识发现模型的设计   总被引:11,自引:3,他引:8  
KDD(the Knowledge Discovery in Database)模型的研究是数据挖掘领域中的一个重要分支,现有的一些模型各有其优势,但又不是完美的,尤其在智能性方面都表现得较差。文章设计了一个基于Agent的智能数据挖掘系统,利用多智能体技术实现了信息的收集、预处理、查询、知识的自动提取、数据挖掘等功能,使整个挖掘过程实现了知识性、智能性,它可以为智能信息系统提供必要的支持。  相似文献   

10.
数据挖掘,也可以称为数据库中的知识发现(Knowledge Discovery in Database,KDD).决策树是数据挖掘的一个重要的技术.本文尝试把数据挖掘的方法和技术,通过实现SLIQ算法把该技术应用到税务稽查的计算机选案的途径.  相似文献   

11.
基于网络环境的分布式KDD及Data Mining研究   总被引:5,自引:1,他引:4  
本文针对KDD的研究现状及其面临的挑战,主要讨论了基于网络环境下,面向多个站点机,多种数据库、多类数据源的分布式KDD和Data Mining的整体方案和实验系统模型,研究内容包括高效分布式开采算法,KDD过程的无缝集成,KDD中的知识表示、知识更新以及开采结果可视化的有效方法等。  相似文献   

12.

While knowledge discovery in databases (KDD) is defined as an iterative sequence of the following steps: data pre-processing, data mining, and post data mining, a significant amount of research in data mining has been done, resulting in a variety of algorithms and techniques for each step. However, a single data-mining technique has not been proven appropriate for every domain and data set. Instead, several techniques may need to be integrated into hybrid systems and used cooperatively during a particular data-mining operation. That is, hybrid solutions are crucial for the success of data mining. This paper presents a hybrid framework for identifying patterns from databases or multi-databases. The framework integrates these techniques for mining tasks from an agent point of view. Based on the experiments conducted, putting different KDD techniques together into the agent-based architecture enables them to be used cooperatively when needed. The proposed framework provides a highly flexible and robust data-mining platform and the resulting systems demonstrate emergent behaviors although it does not improve the performance of individual KDD techniques.  相似文献   

13.
采用数据挖掘技术来扩展入侵检测的功能以判别未知攻击是当前的一个研究热点。本文在分析了各种数据挖掘算法的基础上,提出将k-NN分类规则运用于入侵检测,给出了可运用于入侵检测的k-NN分类规则改进算法k-NN for IDS。最后,我们在KDD99上对k-NN for IDS算法进行试验,验证了算法的有效性。  相似文献   

14.
基于改进粗糙逼近近似度量的数据挖掘方法   总被引:1,自引:0,他引:1  
数据挖掘是知识发现领域的一个重要问题,粗糙集理论是一种具有模糊边界的数据挖掘方法,它被广泛应用于决策系统的分类规则提取中。论文在决策表条件属性重要性度量的基础上,根据条件属性对决策类划分的逼近近似度量,提出了基于改进粗糙逼近近似度量的数据挖掘进行属性约减方法,并用算例验证了算法的合理性和可行性。  相似文献   

15.
信息提取的能力与效率已成为限制遥感应用发展的瓶颈问题。数据开采(DM)与知识发现(KDD)概念的提出及其理论体系的建立为解决这一问题提供了一种全新的视角。基于对DM和KDD的过程分析和对卫星遥感数据的信息论理解,提出了针对地质应用的卫星遥感数据开采与知识发现的技术框架。以此为主线,把时相选择考虑为知识发展过程的一个特定步骤;在研究地质遥感信息的时间效应基础上,探讨了目标知识发现的“微差信息处理”方法和信息融合技术,应用实例证明该框架的合理性及其相应方法的实际意义。  相似文献   

16.
王凤梅  胡丽霞 《计算机工程》2012,38(21):53-55,62
数据缺失是数据挖掘与分析过程中的常见问题,若直接删除含缺失的事例可能导致不可靠的决策。为此,针对缺失数据的填补问题,提出一种基于近邻规则的缺失数据填补方法。根据关联规则的后件数据项进行分类,计算分类后的规则项与缺失项集间的相似度,用最相似的规则项值填补缺失值。实验结果表明,该方法具有较高的填补正确率。  相似文献   

17.
提出知识发现中的可继承性问题,通过对知识发现过程和挖掘算法形式化描述和分析,抽象出各个阶段的形式联系及其约束条件,在此基础上提出初等知识的概念.在引入初等知识后,对传统的挖掘算法、增量式挖掘算法、可继承性挖掘算法进行形式化描述和比较,得出如下结论:可继承性挖掘算法能够有效的提高数据集变化、参数变化情况下的数据挖掘效率.  相似文献   

18.
面向入侵检测的数据挖掘是目前国际上网络安全和数据库、信息决策领域的最前沿的研究方向之一。入侵检测中进行序列模式挖掘时,由于频繁网络模式和频繁系统活动模式只能在网络或操作系统的单个审计数据流中获得,因而传统从事件流数据中获取单序列模式的算法,以及从不同多数据序列中获取多个序列模式的算法都不再适用。本文研究了入侵数据的特性,提出了网络入侵检测中序列模式挖掘框架和实时序列模式挖掘模型,并设计了一种新的面向入侵检测.基于轴属性、参考属性、相关支持度的序列模式挖掘算法SPM—ID(Sequential Patterns Mining for Intrusion Detection)。最后在KDD Cup99数据集的基础上实现算法及分析算法的性能。  相似文献   

19.
Architecture for knowledge discovery and knowledge management   总被引:1,自引:0,他引:1  
In this paper, we propose I-MIN model for knowledge discovery and knowledge management in evolving databases. The model splits the KDD process into three phases. The schema designed during the first phase, abstracts the generic mining requirements of the KDD process and provides a mapping between the generic KDD process and (user) specific KDD subprocesses. The generic process is executed periodically during the second phase and windows of condensed knowledge called knowledge concentrates are created. During the third phase, which corresponds to actual mining by the end users, specific KDD subprocesses are invoked to mine knowledge concentrates. The model provides a set of mining operators for the development of mining applications to discover and renew, preserve and reuse, and share knowledge for effective knowledge management. These operators can be invoked by either using a declarative query language or by writing applications.The architectural proposal emulates a DBMS like environment for the managers, administrators and end users in the organization. Knowledge management functions, like sharing and reuse of the discovered knowledge among the users and periodic updating of the discovered knowledge are supported. Complete documentation and control of all the KDD endeavors in an organization are facilitated by the I-MIN model. This helps in structuring and streamlining the KDD operations in an organization.  相似文献   

20.
基于Web的数据采掘   总被引:19,自引:0,他引:19  
本文论述了知识发现的数据采掘的概念以及所使用的技术,并分析了在INTERNET进行数据采掘的特点和难点。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号