共查询到20条相似文献,搜索用时 156 毫秒
1.
针对现有的决策点规则挖掘研究在挖掘时都只考虑了业务对象等过程外部对象的属性,而忽视了业务过程的内部属性——各决策点间的结构关系——对决策点的分支选择决策的影响,在深入研究过程内部属性提取方法的基础上,提出了一种基于过程挖掘的决策规则发现算法。该算法在挖掘决策规则时综合考虑过程外部对象属性和业务过程内部属性,从而可以更加全面、准确地挖掘决策点决策规则。实验结果证明,该算法能够有效挖掘业务过程决策规则,从而帮助用户更好地分析和理解实际业务过程。 相似文献
2.
关联规则挖掘是经典的数据挖掘方法,越来越多的企业都把它看作是必不可少的战略分析工具。当前关联规则挖掘方法得到的规则过多,令用户在运用时难以理解,因此研究关联规则集的约简方法具有应用价值。研究了数据库模式中关键字包含的主属性对基于Apriori算法的关联规则挖掘产生的关联规则的影响,即部分函数依赖会导致关联规则挖掘的数据集中冗余信息的频繁出现,并产生没有实际价值的关联规则,识别并消除这样的规则就能实现规则集的约简。求全部主属性如同求所有候选关键字问题都是NP难题,因此提出了一种基于一个候选关键字进行验证的算法来判定主属性,从而完成基于主属性判定的关联规则挖掘约简算法的设计与实现,并在最后的实验中验证了该算法的有效性。 相似文献
3.
关联规则在肿瘤诊断中的应用 总被引:6,自引:0,他引:6
挖掘肿瘤诊断数据库中的关联规则,能为肿瘤诊断提供有用的信息。肿瘤诊断数据库中的属性常为数量型属性,因此如何将数量型属性离散化是挖掘关联规则的难点。竞争聚集算法综合了分层聚类与划分聚类的优点,它能够有效地体现数据的实际分布情况并得到优化的聚类个数,因此能将数量型属性离散化成若干个优化的区间。 相似文献
4.
张淮中 《计算机工程与应用》2003,39(13):125-126
探讨了决策规则的数据约简问题,对条件属性与决策属性在决策表中的概率关联给出了有关结论,推导出基于先验概率的决策规则冗余条件,从而获得基于先验概率的数据约简方法,并用应用实例进行了验证。 相似文献
5.
犯罪行为是刑事案件构成要素的核心,运用关联规则挖掘技术可以发现刑事案件数据中各属性的关联,从而对犯罪行为的相关因素进行分析。文章提出了一种基于SQL语言的面向案件数据中目标属性的多维关联规则挖掘算法,可以避免数据开采关联模型中查找规则的盲目性和冗余性,得出的结果可辅助公安机关进行犯罪信息研判。 相似文献
6.
7.
数字属性的优化关联规则开采 总被引:2,自引:0,他引:2
关联规则揭示了关系表中属性之间潜在的联系,优化关联规则是发现特定属性间用户最感兴趣关系的一种有效途径。该文提出了一种基于数字属性的优化关税规则开采算法,该算法允许优化关联规则包含多维析取范式。 相似文献
8.
9.
在提取满足用户特定需求的关联规则时,由于现有约束性关联规则挖掘算法存在大量的冗余候选项和重复计算,故提出一种基于属性位复用的约束性关联规则挖掘算法,其适合挖掘任何长度且满足用户特定需求的关联规则。该算法通过属性位的权值组合,将交易事务转换成整数,用属性位复用技术构建候选区间,并利用其端点值双向变化,构建索引候选频繁项,同时也用布尔运算计算其支持数。实验证明其比现有算法更快速,将其应用到客户关系管理系统中分析客户关联信息,可以有效地提高系统效率。 相似文献
10.
关联规则的挖掘是数据挖掘研究中的一个重要课题,目前已经提出了许多用于发现海量事务库中关联规则的算法以及更新已经发现的关联规则的算法。但是在关联规则的更新算法中,都是基于支持度变化和事务库变化的研究,目前没有人研究当事务库中的属性发生变化时,如何高效地更新关联规则的问题。针对这种情况,提出了三种基于属性变化的增量关联规则挖掘算法ACA+(Attribute Change Algorithm)和ACA-(ACA1-),从而解决了该问题。 相似文献
11.
基于属性分类的数据挖掘方法 总被引:13,自引:0,他引:13
随着数据仓库的广泛应用,从数据中获取相关的知识或规则越发显得重要,各种各样的数据挖掘技术提出了出来,本文介绍一个基于数据属性值的数据挖掘方法。首先简单介绍了ID3分类技术,然后详细论述了基于属性值分类的数据挖掘的方法。该方法有两个的步骤:数据采集,整理及形成规则并化简规则。 相似文献
12.
13.
针对面向领域用户的决策规则挖掘问题,用属性序描述领域用户的需求和兴趣,模拟人脑分辨事物的过程,提出了一种属性序下的分层递阶决策规则挖掘算法.该算法在给定属性序下输出的决策规则集不仅具有唯一性,且对任意待识别样本不会作出矛盾的决策.实例和仿真实验结果表明了算法的有效性和可行性. 相似文献
14.
在数据挖掘领域,关联规则的挖掘和基于粗糙集理论抽取决策规则是两种截然不同的方法,但在统计意义下两种方法产生的规则基本相同。结合关联规则挖掘方法和粗糙集方法的优点,基于Apriori算法提出一种优化算法,获取具有一定支持度和可信度阈值且不产生冗余的决策规则,以提高粗糙集属性值约简算法的性能。 相似文献
15.
在分析C4.5算法原理的基础上,进一步讨论了C4.5算法在决策树的规模控制、属性选择、滤躁和去除不相关属性等方面的不足,讨论了决策树挖掘中对训练数据进行属性约简的必要性。从实用的角度提出了一种利用遗传算法进行寻优的、基于属性约简的决策树构建模型,并为此模型设计了一个适应度函数。该模型具有自适应的特点,通过调整适应度函数的参数,可以约束遗传算法的寻优方向,实现对决策树的优化。实验表明,决策树寻优后,在所用训练集属性减少的同时,分类精度却有一定程度的提高,而分类规则的规模却降低了,因此,该模型具有一定的实用价值。 相似文献
16.
领域文本具有结构复杂、相似性高以及动态变化等特点,且存在着连续型与离散型并存的混合数据,这在一定程度上限制了知识发现方法对文本规则的挖掘效率。针对这一问题,该文提出了基于GMM与粗糙集的文本规则挖掘方法。该方法首先根据目标数据的属性类型构造信息表;然后利用高斯混合模型(GMM,Gaussian Mixture Model)聚类算法对连续数据进行聚类划分,依此对数据进行离散化及状态约简,并生成决策表;最后利用粗糙集理论对决策表进行属性约简,通过约简表对决策规则进行提取。实验结果表明: 相比于传统的方法,该文方法拥有更高的抽取精度以及较强的属性约简能力,其信息抽取的平均准确率与F1值能够达到95.0%和95.7%。 相似文献
17.
核属性蚁群算法的规则获取 总被引:1,自引:0,他引:1
蚁群算法是一种新型的模拟进化算法,研究已经表明该算法具有许多优良的性质,并且在优化计算中已得到了很多应用.粗糙集理论作为一种智能数据分析和数据挖掘的新的数学工具,其主要优点在于它不需要任何关于被处理数据的先验或额外知识.本文从规则获取和优化两方面研究基于粗糙集理论和蚁群算法的分类规则挖掘方法.通过研究决策表和决策规则系数,建立基于粗糙集表示和度量的知识理论,将粗糙集理论与蚁群算法融合,采用粗糙集理论进行属性约简,利用蚁群算法获取最优分类规则,优势互补.实验结果比较表明,算法获取的分类规则,具有良好的预测能力和更为简洁的表示形式. 相似文献
18.
关联规则是数据挖掘的重要研究内容之一。传统的关联规则挖掘算法仅适于处理二元属性与分类属性。为更好地处理数量属性,提出了一种自适应的基于模糊概念的量化关联规则挖掘算法。该算法克服了传统的离散分区法的不足,改进了已有模糊关联规则支持度的计算方法。引入了一种基于聚类的隶属函数自动生成方法,使得模糊关联规则的发现不依赖于人类专家给出的隶属函数,使得关联规则的表示自然、简明,有利于专家理解。实验表明该算法是有效的。 相似文献
19.
基于模糊概念层的核属性集确定方法及其应用 总被引:1,自引:1,他引:0
核属性集的确定是从海量数据中发现决策规则的重要步骤。该文在结合粗糙集理论和层次聚类方法的基础上,改进了已有的模糊概念层核属性集确定方法,不仅能运用模糊概念层方法对原始数据进行模糊化处理,排除边缘数据的干扰作用,还可减少噪声数据的干扰作用以进一步简化可区分矩阵,得出核属性集且使得生成的判定规则可信度更高。最后以汽车生产厂商汽车样本各项指标实测数据为例论证了算法的有效性和实用性。 相似文献
20.
基于Rough Set带结论域的关联规则挖掘 总被引:2,自引:0,他引:2
论文构建了一种基于RoughSet(RS)带结论域的强关联规则挖掘模型,采用约简决策表和改进的Apriori算法来挖掘关联规则,提高了关联规则的挖掘效率和挖掘质量,提出并实现了带结论域的关联规则挖掘的解决方案。 相似文献