首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 274 毫秒
1.
KDD中知识评价的研究综述   总被引:12,自引:1,他引:11  
在知识发现过程中,通过挖掘算法产生大量的模式,但是大多数用户对此不感兴趣。如何对它们进行评价,选取出用户感兴趣的和有用的知识成为至关重要的一环,故对知识评价的研究具有重要的意义。首先分析了评价过程与知识发现的结合方式;针对评价的综合度量标准(感兴趣度),从客观性和主观性两个方面分别进行了介绍;并针对因果关联规则概述了我们提出的一种新的评价方法。  相似文献   

2.
针对序信息系统,基于优势关系给出了知识协调度和知识差异度的概念,为刻画和度量序意义下知识之间的协调程度和差异程度提供了一种新方法。讨论和分析了这些度量的性质及它们之间的关系,通过实例表明了上述度量的有效性。这些结论将有助于序信息系统的知识发现研究。  相似文献   

3.
菅利荣  刘思峰 《控制与决策》2005,20(11):1291-1295
为了从模糊近似空间中获取用于概率决策的规则,在决策类的粗糙近似中,通过应用λ-截集,将模糊不可分辨关系转化为等价关系,提出一种可从模糊决策表中获取概率规则的扩展变精度粗糙集方法.讨论了其中的一些集合理论性质,并对输出类别的模糊粗糙性给出了距离度量和熵度量两种模糊度量方法.研究结果表明,该方法可从模糊、不完备且有噪声的数据库中发现知识.  相似文献   

4.
面向对象软件设计最优规则能够指导设计出优化结构,提高OO设计的结构质量,使设计更易维护。Riel规则是其中一种重要的设计最优规则。链接分析度量是针对OO类图模型质量的一种度量方法。文中研究了Riel规则及链接分析度量方法,并分析了链接分析度量方法与Riel规则及OO模型质量的关系。结论表明Riel规则指出了OO设计应避免创建“上帝”(God)类,链接分析度量能够识别出具有上帝(“God”)角色的类,指导设计者的设计遵守Riel规则。有效地使用链接分析度量,使OO设计符合Riel规则,可以及早发现问题,提出改进意见,从而提高OO软件的质量。  相似文献   

5.
针对现有基于语义知识规则分析的文本相似性度量方法存在时间复杂度高的局限性,提出基于分类词典的文本相似性度量方法。利用汉语词法分析系统ICTCLAS对文本分词,运用TF×IDF方法提取文本关键词,遍历分类词典获取关键词编码,通过计算文本关键词编码的近似性来衡量原始文本之间的相似度。选取基于语义知识规则和基于统计两个类别的相似性度量方法作为对比方法,通过传统聚类与KNN分类分别对相似性度量方法进行效果验证。数值实验结果表明,新方法在聚类与分类实验中均能取得较好的实验结果,相较于其他基于语义分析的相似性度量方法还具有良好的时间效率。  相似文献   

6.
面向对象软件设计最优规则能够指导设计出优化结构,提高OO设计的结构质量,使设计更易维护.Riel规则是其中一种重要的设计最优规则.链接分析度量是针对OO类图模型质量的一种度量方法.文中研究了Riel规则及链接分析度量方法,并分析了链接分析度量方法与Riel规则及OO模型质量的关系.结论表明Riel规则指出了OO设计应避免创建"上帝"(God)类,链接分析度量能够识别出具有上帝("God")角色的类,指导设计者的设计遵守Riel规则.有效地使用链接分析度量,使OO设计符合Riel规则,可以及早发现问题,提出改进意见,从而提高OO软件的质量.  相似文献   

7.
通过研究决策表和决策规则的不确定性,分析了由不分明关系划分的粒度引起的规则不确定性的两个方面,即不一致性和随机性,建立基于信息熵和粗糙集表示的不确定性信息度量的方法.利用该方法计算决策表局部最小确定性,并以此为阈值来控制规则集生成的数量,避免不必要的冗余规则的生成.同时结合Skowron的缺省规则获取算法,实现了没有领域先验知识条件下的不确定知识的自适应学习过程.试验结果表明.阈值的选取是合理的,在保持较高的决策正确率的同时,有效地控制了规则集的生成.  相似文献   

8.
关联规则是数据库中的知识发现(KDD)领域的重要研究课题。模糊关联规则可以用自然语言来表达人类知识,近年来受到KDD研究人员的普遍关注。但是,目前大多数模糊关联规则发现方法仍然沿用经典关联规则发现中常用的支持度和置信度测度。事实上,模糊关联规则可以有不同的解释,而且不同的解释对规则发现方法有很大影响。从逻辑的观点出发,定义了模糊逻辑规则、支持度、蕴含度及其相关概念,提出了模糊逻辑规则发现算法,该算法结合了模糊逻辑概念和Apriori算法,从给定的定量数据库中发现模糊逻辑规则。  相似文献   

9.
Vague集相似度量   总被引:9,自引:0,他引:9  
在不确定信息处理中,判定两个知识模式的相似度是知识划分、规则推理的前提.Vague集是处理模糊信息的一种有效工具,众多学者提出了基于Vague集的相似度量方法,但这些方法不足以准确描述Vague集的相似本质,并且度量的准确度较低.本文提出了一种度量Vague集相似度量方法的标准,为研究Vague集相似度量提供了参考;提出了一种新的Vague集相似度量的方法.实验结果表明,本文方法的区分能力高,并且有更好的度量效果.  相似文献   

10.
基于改进粗糙逼近近似度量的数据挖掘方法   总被引:1,自引:0,他引:1  
数据挖掘是知识发现领域的一个重要问题,粗糙集理论是一种具有模糊边界的数据挖掘方法,它被广泛应用于决策系统的分类规则提取中。论文在决策表条件属性重要性度量的基础上,根据条件属性对决策类划分的逼近近似度量,提出了基于改进粗糙逼近近似度量的数据挖掘进行属性约减方法,并用算例验证了算法的合理性和可行性。  相似文献   

11.
由规则归纳系统中发掘感兴趣模式   总被引:1,自引:0,他引:1  
文章借助粗糙集理论,提出一种面向大型数据库的规则归纳方法;然后在评价规则的置信度和支持度的基础上,引入兴趣度准则进一步对规则进行评价,并介绍了两种针对不同问题的兴趣度指标,提出兴趣模板的概念来描述令人感兴趣的规则特征以强化用户的参与作用,提高系统效率。  相似文献   

12.
Many studies have shown the limits of the support/confidence framework used in Apriori ‐like algorithms to mine association rules. There are a lot of efficient implementations based on the antimonotony property of the support, but candidate set generation (e.g., frequent item set mining) is still costly. In addition, many rules are uninteresting or redundant and one can miss interesting rules like nuggets. We are thus facing a complexity issue and a quality issue. One solution is to not use frequent itemset mining and to focus as soon as possible on interesting rules using additional interestingness measures. We present here a formal framework that allows us to make a link between analytic and algorithmic properties of interestingness measures. We introduce the notion of optimonotony in relation with the optimal rule discovery framework. We then demonstrate a necessary and sufficient condition for the existence of optimonotony. This result can thus be applied to classify the measures. We study the case of 39 classical measures and show that 31 of them are optimonotone. These optimonotone measures can thus be used with an underlying pruning strategy. Empirical evaluations show that the pruning strategy is efficient and leads to the discovery of nuggets using an optimonotone measure and without the support constraint.  相似文献   

13.
基于统计相关性的兴趣关联规则的挖掘   总被引:8,自引:0,他引:8  
本文首先对关联规则的支持—置信框架存在的不足进行了分析,然后引入了规则的兴趣度概念,利用兴趣度来约束冗余关联规则的产生,以提高挖掘知识的有用性,并给出了算法描述。  相似文献   

14.
In data mining applications, it is important to develop evaluation methods for selecting quality and profitable rules. This paper utilizes a non-parametric approach, Data Envelopment Analysis (DEA), to estimate and rank the efficiency of association rules with multiple criteria. The interestingness of association rules is conventionally measured based on support and confidence. For specific applications, domain knowledge can be further designed as measures to evaluate the discovered rules. For example, in market basket analysis, the product value and cross-selling profit associated with the association rule can serve as essential measures to rule interestingness. In this paper, these domain measures are also included in the rule ranking procedure for selecting valuable rules for implementation. An example of market basket analysis is applied to illustrate the DEA based methodology for measuring the efficiency of association rules with multiple criteria.  相似文献   

15.
In data mining applications, it is important to develop evaluation methods for selecting quality and profitable rules. This paper utilizes a non-parametric approach, Data Envelopment Analysis (DEA), to estimate and rank the efficiency of association rules with multiple criteria. The interestingness of association rules is conventionally measured based on support and confidence. For specific applications, domain knowledge can be further designed as measures to evaluate the discovered rules. For example, in market basket analysis, the product value and cross-selling profit associated with the association rule can serve as essential measures to rule interestingness. In this paper, these domain measures are also included in the rule ranking procedure for selecting valuable rules for implementation. An example of market basket analysis is applied to illustrate the DEA based methodology for measuring the efficiency of association rules with multiple criteria.  相似文献   

16.
影响关联规则挖掘的有趣性因素的研究   总被引:7,自引:2,他引:7  
关联规则挖掘是数据挖掘研究中的一个重要方面,而其中一个重要问题是对挖掘出的规则的感兴趣程度的评估。实际应用中可从数据源中挖掘出大量的规则,但这些规则中的大部分对用户来说是不一定感兴趣的。关联规则挖掘中的有趣性问题可从客观和主观两个方面对关联规则的兴趣度进行评测。利用模板将用户感兴趣的规则和不感兴趣的规则区分开,以此来完成关联规则有趣性的主观评测;在关联规则的置信度和支持度基础上对关联规则的有趣性的客观评测增加了约束。  相似文献   

17.
兴趣度量在关联规则挖掘中常用来发现那些潜在的令人感兴趣的模式,基于FP树结构的FP-growth算法是目前较高效的关联规则挖掘算法之一,如果挖掘潜在的有价值的低支持度模式,这种算法效率较低。为此,本文提出一种新的兴趣度量—项项正相关兴趣度量,该量度具有良好的反单调性,所得到的模式中任意一项在事务中的出现均可提升模式中其余项出现的可能性。同时,提出一种改进的FP挖掘算法,该算法采用一种压缩的FP树结构,并利用非递归调用方法来减少挖掘中建立额外条件模式树的开销。更为重要的是,在频繁项集挖掘中引入项项正相关兴趣度量剪枝策略,有效过滤掉非正相关长模式和无效项集,扩大了可挖掘支持度阈值范围。实验结果表明,该算法是有效和可行的。  相似文献   

18.
关联分类具有较高的分类精度和较强的适应性,然而由于分类器是由一组高置信度的规则构成,有时会存在过度拟合问题。提出了基于规则兴趣度的关联分类(ACIR)。它扩展了TD-FP-growth算法,使之有效地挖掘训练集,产生满足最小支持度和最小置信度的有趣的规则。通过剪枝选择一个小规则集构造分类器。在规则剪枝过程中,采用规则兴趣度来评价规则的质量,综合考虑规则的预测精度和规则中项的兴趣度。实验结果表明该方法在分类精度上优于See5、CBA和CMAR,并且具有较好的可理解性和扩展性。  相似文献   

19.
KDD中因果关联规则的评价方法   总被引:17,自引:0,他引:17  
杨炳儒  綦艳霞 《软件学报》2002,13(6):1142-1147
在KDD(knowledge discovery in database)中,对所发现的知识进行评价是一个很重要的环节.提出了一种针对KDD中因果关联规则的自动评价方法.该评价方法采用了全新的、有效的知识表示方法(语言场和语言值结构)和推理机制(因果关系定性推理机制),并且具有通用性和交互性的特征.给出了此评价方法的理论依据和构造过程,并提供了相应的算法.通过对具体实例的运行检验,证明了此评价方法的有效性.通过与相关工作的比较,证明了其先进性.  相似文献   

20.
关联规则兴趣度问题研究   总被引:5,自引:0,他引:5       下载免费PDF全文
梅志芳  王建 《计算机工程》2010,36(1):38-39,42
经典的关联规则都是使用基于支持度和可信度的度量标准,但经过实践应用证明存在很多问题。为此,引入兴趣度作为关联规则的新度量标准,阐述当前重点研究的客观兴趣度,对PS公式进行探讨,提出它的优点和不足,在此基础上进行相关改进,克服了可信度与支持度框架的缺陷,具有优化关联规则挖掘的作用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号