首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 375 毫秒
1.
数据库中知识发现的处理过程模型的研究   总被引:6,自引:1,他引:5  
1 前言数据库中的知识发现KDD(Knowledge Discov-ery in Database)是近年来随着数据库和人工智能技术的发展而出现的,它是从大量数据中提取出可信的、新颖的、有效的并能被人理解的模式的高级处理过程。它主要采用机器学习算法或统计方法进行知识学习,一般将KDD中进行知识学习的阶段称为数据挖掘(Data Mining)。数据挖掘是KDD中的一个非常重要的处理步骤。人们往往不加区分地使用两者。一般来说,在工程应用领域多称数据挖掘,而在研究领域人们则多称为数据库中的知识发现。人们进行的关于KDD的研究是为了将知识发现的研究成果应用于实际数据处理中,为科学的决策提供支持。正是因为这样,目前所进行的关于  相似文献   

2.
1 引言随着社会信息量的增大,在各种应用领域里的数据库中存储了大量的数据,这使得人们对这些数据进行分析并转化为有用知识的需求变得越来越迫切。于是知识发现与数据挖掘(Knowledge Discovery and Data Mining,KDD)自然成为近年来人们从大型数据库中获取信息的一个重要的研究领域。一般地,数据挖掘就是指从数据库或数据仓库中发现隐藏的、预先未知的、有趣的信息的过程,该过程可以看作是知识发现过程中的一个核心的步骤。目前,能够用于解决机器学习问题的方法主要有三种类型,即:模糊规则的学习方法、神经网络学习方法和遗传进化的学习方法。纵观数据挖掘中的规则提取方法,决策树规则提取方法不能实现多变量搜索,因为它在建树时每一个节点只含有一个特征,故属于一  相似文献   

3.
知识当现方法的比较研究   总被引:5,自引:0,他引:5  
1 引言从已有信息中发现模式或规律是信息处理技术的本质所在。长期以来,为了实现这个目标人们从不同领域、不同角度提出各种方法。典型的如:从数学角度提出的数理统计方法、从模拟生物神经结构角度提出的神经网络技术、从知识角度提出的机器学习方法等。与上述方法不同的是,KDD并不是研究某种具体的方法,而是根据用户的需要和领域的特点,利用已有的技术形成一个完整的系统,在有限的计算资源下从大型数据库中自动地发现知识。因此我们认为,KDD着重于系统的实用性,其主要目的是使上述方法适用于大型数据库以及根据领域特性适当地利用它们。  相似文献   

4.
本文讨论了数据库中知识发现KDD(KnowledgeDiscoveryinDatabases)的抽象模型和应用,描述了一种KDD方法实例。该方法与领域知识密切结合,借鉴了模式识别的有关知识,实现了友好的人—机界面。  相似文献   

5.
KDD中的特征选择   总被引:1,自引:0,他引:1  
随着数据库、数据仓库技术的发展,各种数据处理和分析工具不断出现,数据库中的知识发现(简称KDD)就是现在受到研究人员和软件开发商广泛关注的一种数据分析方法。文章主要针对KDD的数据预处理阶段的一类重要问题———分类问题,描述了特征选择的概念,分析了它在KDD中应用的重要性和必要性,并针对KDD的特点介绍现有的特征选择的各种方法并进行归纳,为下一步的研究和开发提供一个有益的框架。  相似文献   

6.
知识发现是一个众多学科诸如人工智能、机器学习、模式识别、统计学、数据库和知识库、数据可视化等相互交叉、融合所形成的一个新兴的且具有广阔应用前景的领域。目前国际上对知识发现的研究与开发进展很快。众多现实世界(如天气预报、电信、金融)的数据库中数据都是随时间变化的,即数据具有时序性。目前,时序数据库中的知识发现问题正逐渐引起KDD研究者的兴趣。本文首先给出时  相似文献   

7.
数据挖掘中的数据预处理   总被引:34,自引:0,他引:34  
1 引言数据挖掘(Data Mining,简称DM),也称为数据库中的知识发现KDD(Knowledge Discovery inDatabase),是近几年来随着数据库和人工智能发展起来的一门新兴的数据库技术。其处理对象是大量的日常业务数据,目的是为了从这些数据中抽取一些有价值的知识或信息。原始业务数据是知识和信息提取的源泉,对于数据挖掘就显得十分重要。目前所进行的关于数据挖掘的研究工作,大多着眼于数据挖掘算法的探讨,而忽视了对数据处理的研究。目前一些比较成  相似文献   

8.
通过在数据预处理,知识获取,知识库管理等模块中利用中断控制器和启发控制器把KDD有机集成起来,融合成一种新的专家系统结构,从而使系统能从海量数据库信息中提取蕴涵的知识来对知识库进行补充和核对。利用系统提供的KDD算法对NIST62质谱库进行分析,结果表明该系统具有较普通专家系统更强的解决实际问题的能力。  相似文献   

9.
基于多层次概念提升的知识发现方法   总被引:5,自引:0,他引:5  
1 引言数据库中的知识发现KDD(Knowledge Discoveryin Database),也称为数据挖掘(Data Mining,简称DM),是近几年来随着数据库和人工智能发展起来的一门新兴的数据库技术。它从大量原始数据中挖掘出隐含的、有用的尚未发现的信息和知识(如规则、模型、规律、模式、约束等),帮助决策者寻找数据间潜在的关  相似文献   

10.
目前在工业现场中能很容易地获取大量的过程参数数据,而传统方法处理这些数据既费时又费力,在这些大量的未分析或待分析的数据中很有可能隐藏着有用的信息.KDD(数据库中的知识发现)旨在大量数据中发现有价值的信息.本文针对工业领域中数据信息的特点,介绍了KDD技术在工业领域的应用关键,并结合火力发电厂阐述了KDD在工业领域中的应用前景.  相似文献   

11.
数据挖掘技术在农业数据中的有效应用   总被引:23,自引:0,他引:23  
农业信息系统的建立和大量农业数据的增长,人工获取知识和分析数据变得越来越难,需要对数据进行自动分析并获取知识。KDD和数据挖掘技术在农业中得到应用,由于农业领域本身的特点,通常的数据挖掘技术得不到有效应用。该文提出了几种对农业数据库进行知识发现的有效方法,并将知识发现方法与信息系统紧密结合。  相似文献   

12.
模糊数据挖掘   总被引:5,自引:0,他引:5  
本文在数据库中知识发现(KDD)和数据挖掘(DM)技术的基础上,提出了模糊数据库中知识发现(KDFD)和模糊数据挖掘(FDM)的概念与技术,并给出FDM的算法,它能有效地挖掘出模糊数据库中潜在的有价值的知识。本文具体讨论了模糊关联规则及模糊数据依赖的挖掘。  相似文献   

13.
关联规则是数据库中的知识发现(KDD)领域的重要研究课题。模糊关联规则可以用自然语言来表达人类知识,近年来受到KDD研究人员的普遍关注。但是,目前大多数模糊关联规则发现方法仍然沿用经典关联规则发现中常用的支持度和置信度测度。事实上,模糊关联规则可以有不同的解释,而且不同的解释对规则发现方法有很大影响。从逻辑的观点出发,定义了模糊逻辑规则、支持度、蕴含度及其相关概念,提出了模糊逻辑规则发现算法,该算法结合了模糊逻辑概念和Apriori算法,从给定的定量数据库中发现模糊逻辑规则。  相似文献   

14.
针对谱图数据库的特性,在利用数据库知识发现(KDD)技术对谱图数据库进行数据预处理过程中,利用面向属性的归纳法对数据属性间的相关性进行分析,Multi_AdaBoost算法进行聚类分析和统计方法对Beynon表进行审核等方面进行了研究,这样,对质谱库有了更进一步的认识,为构建质谱智能解析系统的知识库和质谱解析的智能化打下了良好的基础。  相似文献   

15.
KDD查询语言研究   总被引:1,自引:0,他引:1  
知识发现和数据开采(简称为KDD)就是从大量数据中析取事先隐藏未明却又潜在可用的模式你(Pattefhs)~[5]。然而KDD领域还缺乏独立性,大多数从事机器学习(machine learning)领域的入把  相似文献   

16.
从数据挖掘到知识发现   总被引:1,自引:0,他引:1  
<正> KDD简介 过去的十年里,生成和收集数据的能力迅猛发展。科学数据集、商品的条形码、商业的计算机化和政府事务等都产生了海量的数据。 如此大量的数据明显超出了传统手工数据分析方法的分析能力。这些方法能够从数据中产生信息报告,但不能分析这些报告的内容以便集中处理。这就要求新一代技术与工具具备智能地并且自动地帮助人们分析海量数据来获取有用知识的能力。 从原始数据中发现有用的模式(或知识)通常称之为数据库中的知识发现,简称KDD。这种称法出现于  相似文献   

17.
本文针对谱图数据库的特性,在利用数据库知识发现(KDD)技术对谱图数据库进行数据预处理过程中,对质谱匹配算法、Multi_AdaBoost聚类分析算法和Beynon表审核等方面进行了研究,使我们对质谱库有了更进一步的认识,为构建质谱智能解析系统的知识库和质谱解析的智能化打下了良好的基础。  相似文献   

18.
文章通过对基于数据库的知识发现系统(KDD)的研究,提出了双库协同机制,它改变了KDD的结构、运行过程与机制,形成新的知识发现系统KDD。将该发现系统应用于农业领域,为合理地指导农业生产提供了科学的决策,因而具有重要的理论意义和实用价值。  相似文献   

19.
一、引言 KDD是指从数据库中发现有价值信息的整个过程,而数据开采(DM)则是指在这个过程中的一个步骤,是针对某一具体问题的算法的实现。除了DM步骤,KDD还包括前处理(数据准备等)和后  相似文献   

20.
从数据库中发掘定量型关联规则   总被引:6,自引:0,他引:6  
一、引言随着数据库技术和机器学习技术的发展,在数据库中发现新颖的、具有潜在效用的知识,简称KDD(Knowledge Discovery in Database)是近年来的一个新兴研究领域。KDD中的关联规则是描述数据库中数据项(属性,变量)之间所存在的(潜在)关系的规则。我们作如下形式化定义: 令I={i_1,i_2……,i_m}为项目集(itemset),D为事务数据库,其中每个事务T是一个项目子集(TI),并具有一个唯一的标识符ID。关联规则是形如XY的逻辑蕴含式,其中XT,YT,且X∩Y=φ。有两个因子与这条规则相关;如果事务数据库中有s%的事务包含X∪Y,那么我们说关联规则XY的支持度(support)为s;如果事务数据库里包含X的事务中有c%的事务同时也包含Y,那么我们说关联规则XY的置信度(confidence)为c。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号