共查询到20条相似文献,搜索用时 46 毫秒
1.
1 引言在知识发现过程中,通过数据挖掘算法产生大量的模式和规则,但是大多数用户并不感兴趣。面对如此众多的模式和规则,用户不能很好地去理解它们从而无法把精力集中在其中真正感兴趣的子集上。因此,如何定义和确定好的度量标准,识别出用户感兴趣的和有用的知识成为至关重要的一环,所以对感兴趣的度量标准(感兴趣度)的研究是知识发现的重要内容。感兴趣度分为客观感兴趣度和主观感兴趣度。客观感兴趣度主要根据模式或规则的形式和数据库中的数据进行定义,属于数据驱动;而主观感兴趣度还要考虑用户的参与等人为因素的影响,属于用户驱动.单纯的只使用客观感兴趣度是不够的,它不能考虑模式和规则的所有方面,同时感兴趣的问题从本质上将是一个主观的问题,不同的用户感兴趣的规则和模式是不一样,因此需要用户的参与。所以要综合使用客观感兴趣度和主观感兴趣度这两种度量标准。比较合理的方 相似文献
2.
KDD中知识评价的研究综述 总被引:11,自引:1,他引:11
在知识发现过程中,通过挖掘算法产生大量的模式,但是大多数用户对此不感兴趣。如何对它们进行评价,选取出用户感兴趣的和有用的知识成为至关重要的一环,故对知识评价的研究具有重要的意义。首先分析了评价过程与知识发现的结合方式;针对评价的综合度量标准(感兴趣度),从客观性和主观性两个方面分别进行了介绍;并针对因果关联规则概述了我们提出的一种新的评价方法。 相似文献
3.
从数据库中发掘定量型关联规则 总被引:6,自引:0,他引:6
一、引言随着数据库技术和机器学习技术的发展,在数据库中发现新颖的、具有潜在效用的知识,简称KDD(Knowledge Discovery in Database)是近年来的一个新兴研究领域。KDD中的关联规则是描述数据库中数据项(属性,变量)之间所存在的(潜在)关系的规则。我们作如下形式化定义: 令I={i_1,i_2……,i_m}为项目集(itemset),D为事务数据库,其中每个事务T是一个项目子集(TI),并具有一个唯一的标识符ID。关联规则是形如XY的逻辑蕴含式,其中XT,YT,且X∩Y=φ。有两个因子与这条规则相关;如果事务数据库中有s%的事务包含X∪Y,那么我们说关联规则XY的支持度(support)为s;如果事务数据库里包含X的事务中有c%的事务同时也包含Y,那么我们说关联规则XY的置信度(confidence)为c。 相似文献
4.
动态知识系统的规则约简方法 总被引:1,自引:0,他引:1
1 引言知识系统中的规则约简是知识发现、数据挖掘的重要内容。近年来粗集(Rough sets)理论在知识约简的应用已成为计算机科学的热点问题。对静态数据的规则约简已有多种算法。但知识系统往往是动态的。本文给出了一种针对动态知识系统的基于粗集理论的规则约简方法。对知识系统而言,动态一般指记录或论域的元素不断增加。因此,有关处理动态系统的一些方法又称为增量式算法。文章给出了所提出方法的有效性的结论以及实验的结果。 相似文献
5.
多最小支持度规则的挖掘算法 总被引:4,自引:0,他引:4
支持度是数据挖掘中度量客观兴趣度的重要指标,最小支持度的设置提高了数据挖掘过程的有效性。但是,由于事件在现实中发生和存在额度上有很大的不一致性,始终保持单一的最小支持度显然是不合理的。该文提出了一种多最小支持度规则的挖掘算法,并应用于蘑菇数据库的挖掘过程,结果证明该算法是合理有效的。 相似文献
6.
1 引言近年来,现实生活中数据量在高速增长,而在数据中发现有效知识的技术却相对匮乏,因此数据挖掘这一领域成为大家注目的焦点。对事务数据库进行分析的一个十分重要内容是关联规则的发现。此问题被Rakesh Agrawal等首先提出,尔后得到了广泛的研究,如文考虑了发现关联规则的效率问题,文考虑了增量发现问题,文考虑了在时间序数据库中发现周期性模式等等。但以上的工作都是将数据库看成是一个整体,没有考虑时间段的问题。最近,B.Oz-den等研究了发现“完全的”周期性关联规则的问 相似文献
7.
面向属性的归纳与概念聚类 总被引:2,自引:0,他引:2
面向属性的归纳是新近提出的一种广泛用于数据库中的知识发现的方法,提出这种方法与一种机器学习方法--概念聚类之间的紧密联系,并描述如何使用一个概念聚类算法进行面向属性的归纳。 相似文献
8.
9.
稠密数据库有趣规则的快速挖掘 总被引:3,自引:0,他引:3
目前,关联规则的挖掘算法主要用于非稠密数据,很少有挖掘稠密数据的算法,而现实世界中有许多数据是稠密的。由于现行的算法不适合稠 密数据的挖掘,本文定义了兴趣度函数,给出了挖掘稠密数据有趣关联的有效算法。该算法与以往不同的是提前过滤掉不满足约束的属性组合,因而提高了速度,同时,使发现的规则更有趣,更易理解。 相似文献
10.
11.
李秀红 《计算机工程与应用》2006,42(24):49-52
基于致粗域和致粗相关域的基本概念,研究了致粗域和致粗相关域的数学结构,给出并证明了致粗域和致粗相关域所满足的一些重要性质和定理。同时,下精确集、上精确集、精确集等几种特殊的粗糙集被重新定义,这些新定义的粗糙集提供了致粗域和致粗相关域的结构信息。最后对粗糙集中具有较大边界域的粗糙问题进行了研究,当致粗域或致粗相关域相对小时,这类粗糙问题可近似为精确问题处理,并给出了近似处理方法。 相似文献
12.
同一关联挖掘算法算法在不同性质的数据上会表现出不同的性能。针对该问题,提出一种有趣关联模式挖掘方法。介绍模式的兴趣度度量,引入兴趣度预处理过程,并将数据分为2种类型,分别采用不同的算法对这2类数据集进行挖掘。实例表明,该方法能有效提高输出模式的质量。 相似文献
13.
14.
树种分类是林业资源监测中的核心问题,而面向对象的树种分类是目前研究的重点,在面向对象分类方法中,难点在于规则集的建立.本文针对面向对象树种分类问题,以福建将乐国有林场为研究区域,ALOS影像为遥感数据源,探讨面向对象分类规则集的建立并进行树种分类.首先,选择最优的分割尺度,并对影像进行多尺度分割;然后,基于粗糙集进行对象特征的属性约简,从对象的34个特征中约简出最能代表树种分类的13种参数,包括波段比值、亮度值、平均灰度值等;最后建立分类规则集.应用该规则集,对实验区影像进行分类,分类精度达80.4509%,效果较好.实验证明本文所提出的方法可高效地利用遥感图像的信息,提高分类精度,为林业资源调查和植被监测提供了有效的辅助手段. 相似文献
15.
基于粗糙集的规则的挖掘 总被引:3,自引:0,他引:3
随着计算机技术的发展,急剧产生海量的数据。如何从这些数据中提取有用的信息是一个重要的问题。一种新的数据分析方法——粗糙集理论被提出。该理论在分类的意义下定义了模糊性和不确定性的概念,是一种处理不确定和不精确问题的新型数学工具。文中首先对近年兴起的粗糙集的基本理论进行了讨论,在此基础上运用粗糙集理论对从数据库中规则的挖掘方法进行了研究。并通过一个实例详细地说明了具体挖掘过程,该实例说明了基于粗糙集进行规则的挖掘是较简单的。 相似文献
16.
朱红 《计算技术与自动化》2003,22(1):31-33
目前,有很多人研究如何从决策表获得最小简化规则集的方法,但在简化的同时往往也埋没了一些对分类有用的冗余规则,文章给出了一种求得完全简化规则集的方法,这些规则本身是最简的,包含了原决策表中所有的隐含规则,对分类决策有着重要意义。 相似文献
17.
现有规则提取方法大多数只能在相容决策系统中提取规则,并且提取出的规则冗余度高、用户不易理解。针对该问题,提出一种基于对象集覆盖的规则提取方法,利用粗糙集理论将对象集划分为相应的等价类,根据属性特征值的一致性程度和相似程度产生有效性规则,通过等价类划分和对象集覆盖解决不相容决策系统的规则提取问题。算例分析结果表明,该方法提取出的规则简单可靠,具有较好的鲁棒性。 相似文献
18.
基于粗糙集理论的规则修正方法 总被引:3,自引:0,他引:3
基于粗糙集理论分别给出了确定性决策规则和可能性决策规则的获取与修正的理论和方法,给出一种利用粗糙集理论解决在增加样本数量情况下的动态规则获取方法,滚动轴承的故障诊断实例证明了该方法的有效性。 相似文献
19.
20.
中学智能辅导代数专家系统规则库的简化 总被引:3,自引:0,他引:3
由于研究问题的复杂性,专家系统规则库中规则量往往十分庞大,这给规则库的管理和维护带来很大不便。该文针对代数智能辅导解题系统,以规则的层次分类为基础,探讨了规则库建立过程中问题复杂度的降低,冗余规则的减少;同时应用粗集方法对其进行约简,精炼了规则库,提高了系统的效率。 相似文献