首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
关联规则挖掘是数据挖掘的重要领域之一,利用粗糙集理论来挖掘关联规则的方法已经得到广泛关注.针对不完备信息系统,提出了基于粗糙集理论的快速ORD关联规则挖掘算法.该算法首先采用基于粗糙集理论的属性约简算法进行属性约简,然后采用快速、高效的冗余项集和冗余规则修剪算法--ORD算法获取关联规则.将该算法与其它同类流行的算法在4个UCI数据集上进行实验比较,结果表明该算法性能良好.  相似文献   

2.
关联分类及较多的改进算法很难同时既具有较高的整体准确率又有较好的小类分类性能。针对此问题,提出了一种基于类支持度阈值独立挖掘的关联分类改进算法—ACCS。ACCS算法的主要特点是:(1)根据训练集中各类数量大小给出每个类类支持度阈值的设定方法,并基于各类的类支持度阈值独立挖掘该类的关联分类规则,尽量使小类生成更多高置信度的规则;(2)采用类支持度对置信度相同的规则排序,提高小类规则的优先级;(3)用综合考虑置信度和提升度的新的规则度量预测未知实例。在多个数据集上的实验结果表明,相比多种关联分类改进算法,ACCS算法有更高的整体分类准确率,且在不平衡数据上也能取得较好的小类分类性能。  相似文献   

3.
王琦  李霞 《计算机工程》2012,38(9):46-48
分析分类规则内属性之间的相关性,提出一种分类规则约简方法。针对原始训练集构造FP树,获取相应的关联规则集,对关联规则后件属性(集),采用置信度α描述该属性(集)相对于其所在分类规则的重要程度。在分类规则集中,约简α值小于阈值?的属性,从而约简分类规则长度。利用UCI机器学习及SDSS DR7数据进行实验,结果表明该方法具有较高的分类效率。  相似文献   

4.
关联规则挖掘是经典的数据挖掘方法,越来越多的企业都把它看作是必不可少的战略分析工具。当前关联规则挖掘方法得到的规则过多,令用户在运用时难以理解,因此研究关联规则集的约简方法具有应用价值。研究了数据库模式中关键字包含的主属性对基于Apriori算法的关联规则挖掘产生的关联规则的影响,即部分函数依赖会导致关联规则挖掘的数据集中冗余信息的频繁出现,并产生没有实际价值的关联规则,识别并消除这样的规则就能实现规则集的约简。求全部主属性如同求所有候选关键字问题都是NP难题,因此提出了一种基于一个候选关键字进行验证的算法来判定主属性,从而完成基于主属性判定的关联规则挖掘约简算法的设计与实现,并在最后的实验中验证了该算法的有效性。   相似文献   

5.
CBA算法是将关联规则挖掘与分类技术相结合的一种分类算法,在许多领域中得到了广泛应用.针对CBA处理海量数据效率低的缺点,提出了一个改进的CBA算法.该算法将粗糙集理论应用到CBA算法中,对决策表进行属性约简,提高了分类关联规则的生成效率;并应用PEP(pessimistic error pruning)方法对候选规则进行剪裁.实验结果表明,该算法比CBA具有更高的分类效率和准确度.  相似文献   

6.
一个最优分类关联规则算法   总被引:1,自引:0,他引:1  
分类和关联规则发现是数据挖掘中的两个重要领域。使用关联规则算法挖掘分类规则被叫做分类关联规则算法,是一个有较好前景的方法。本文提出了一个最优分类关联规则算法——OCARA。该算法使用最优关联规则挖掘算法挖掘分类规则,并对最优规则集排序,从而获得一个分类精度较高的分类器。将OCARA与传统分类算法C4.5和一般分类关联规则算法CBA、RMR在8个UCI数据集上进行实验比较,结果显示OCARA具有更好的性能,证明OCARA是一个有效的分类关联规则挖掘算法。  相似文献   

7.
基于模糊分类关联规则的分类系统   总被引:9,自引:0,他引:9  
为了构建高性能的分类系统,应用模糊集软化数量型属性的划分边界,提出了模糊分类关联规则的挖掘算法。由于模糊集能很好地贴近人类的思维方式,因此挖掘得到的模糊分类关联规则易于被人理解.接着提出了基于模糊分类关联规则的分类系统,并采用遗传优化算法训练分类系统.实例分析的结果表明,基于模糊分类关联规则的分类系统具有较好的精度和可解释性.  相似文献   

8.
传统关联分类算法使用单一最小项目支持度挖掘关联规则,导致稀有项关联规则无法被发现,从而影响分类的准确性和实用性。提出一种多支持度关联规则分类算法MS-CBAR(Multiple Supports-Classification Based on Association Rules),将多最小项目支持度模型应用于关联分类,以有效挖掘稀有项。该算法为数据库中的规则项提供了用户可定义的最小项目支持度。MS-CBAR算法使用项的最小项支持度阈值、类的最小类支持度值和规则项的最小支持度值决定分类规则是否频繁。生成分类规则集后,使用最高优先度规则覆盖法基于规则集建立分类器。实验表明,所提算法在包含稀有项目及稀有类的数据集中准确率高于传统关联分类算法及其相关算法,表现更稳定。  相似文献   

9.
一种高效的多层和概化关联规则挖掘方法   总被引:4,自引:1,他引:3  
毛宇星  陈彤兵  施伯乐 《软件学报》2011,22(12):2965-2980
通过对分类数据的深入研究,提出了一种高效的多层关联规则挖掘方法:首先,根据分类数据所在的领域知识构建基于领域知识的项相关性模型DICM(domain knowledge-based item correlation model),并通过该模型对分类数据的项进行层次聚类;然后,基于项的聚类结果对事务数据库进行约简划分;最后,将约简划分后的事务数据库映射至一种压缩的AFOPT树形结构,并通过遍历AFOPT树替代原事务数据库来挖掘频繁项集.由于缩小了事务数据库规模,并采用了压缩的AFOPT结构,所提出的方法有效地节省了算法的I/O时间,极大地提升了多层关联规则的挖掘效率.基于该方法,给出了一种自顶向下的多层关联规则挖掘算法TD-CBP-MLARM和一种自底向上的多层关联规则挖掘算法BU-CBP-MLARM.此外,还将该挖掘方法成功扩展至概化关联规则挖掘领域,提出了一种高效的概化关联规则挖掘算法CBP-GARM.通过大量人工随机生成数据的实验证明,所提出的多层和概化关联规则挖掘算法不仅可以确保频繁项集挖掘结果的正确性和完整性,还比现有同类最新算法具有更好的挖掘效率和扩展性.  相似文献   

10.
贾桂霞  张永 《计算机工程与设计》2006,27(12):2175-2177,2186
在数据挖掘领域,关联规则的挖掘和基于粗糙集理论抽取决策规则是两种截然不同的方法,但在统计意义下两种方法产生的规则基本相同。结合关联规则挖掘方法和粗糙集方法的优点,基于Apriori算法提出一种优化算法,获取具有一定支持度和可信度阈值且不产生冗余的决策规则,以提高粗糙集属性值约简算法的性能。  相似文献   

11.
在分析Pawlak近似空间Rough集的近似质量时,常采用准确性因子α和精确性因子β;在比较两个划分的好坏时采用属性的依赖度来描述。文章提出了误差度概念,利用误差度能更好地分析Rough集的近似质量,比较分划的优劣;同时也给出了属性依赖度新的表达式。  相似文献   

12.
文献[1]从概念层面上提出并区分模糊概念中存在的三种不同否定关系,即矛盾否定关系、对立否定关系和中介否定关系,由此定义了能够刻画这些不同否定的一种新的模糊集FScom。研究模糊集FScom的模糊度与贴近度,提出模糊集FScom的模糊度、距离贴近度以及格贴近度计算公式,并讨论了它们的应用。  相似文献   

13.
一种新的有限元网格优化方法   总被引:3,自引:0,他引:3  
本文仔细探讨了平面网格产生畸形单元的原因,并针对性地提出了“结构优化”的概念,将其与传统的“位置优化”区别开来。本文介绍的方法通过结构优化与位置优化相结合对初始有限元网格进行调整,使最终的网格最大限度地满足有限元分析的需要,从而提出了一种能够较为彻底地提高网格质量的新的网格优化方法。  相似文献   

14.
考虑犹豫度的Vague集相似度量方法   总被引:1,自引:1,他引:0       下载免费PDF全文
研究了本刊2008年第4期王伟平的论文"Vague集之间相似性度量的基本准则与一般方法"中的Vague集间相似度量方法的优点和不足,考虑到犹豫度之差对相似度的影响,提出同时考虑真隶属度、假隶属度、相对优势、犹豫度之和以及犹豫度之差的Vague集相似度量方法,并证明王伟平相似度量方法的不足和新相似度量方法的优点,并把新相似度量方法应用于病症诊断中。  相似文献   

15.
以LDA为基础的许多主题模型能够从一定数量的文本中推断出主题个数及主题描述,其存在的问题是主题个数难于确定,也难于决定描述每个主题的特征词汇。针对这个问题,结合LDA与TF-IDF量化的效果,同时考虑对原文本集的涵盖程度以及主题间的独立性,提出了一种Overlap-Completeness得分法的主题区分度优选方法。该方法在LDA建模的基础上,利用TF-IDF获取主题最具代表性的词汇,定义主题词汇间的重叠度、表达的完整度,给出了主题优选的评价方法。最终不仅能得到最佳主题数目,而且还能得到每个主题的最合适的描述词汇。在信息安全新闻文本集上进行了实验研究,结果表明该方法与基本的LDA模型相比,更能选择出有区分度的主题和有代表性的词汇。  相似文献   

16.
几何约束满足的统一模型   总被引:8,自引:0,他引:8  
几何约束满足是参数化设计中的中心问题,研究了陈述和构造统一的约束满足策略,通过将冗余约束转化为形状自由度的方法解决了构造序列的约束闭环问题,采用剪枝和凝聚相结合的策略实现了欠约束和完备约束系统的分解,并在参数化设计与绘图系统MDS4.0上实现。  相似文献   

17.
混合式几何约束满足的研究   总被引:5,自引:1,他引:4  
几何约束系统可以分为陈述式和构造式两类。为了使基于约束的设计更加符合使用要求,参数化CAD系统需要综合满足两类约束。文中研究了三维情况下和构造统一的约束满足策略,通过引入形状自由度的概念,将形状变化和集团变化统一处理。约束系统采用约束图来表示,各个子系统之间的层次结构利用约束层次树来表示。采用剪枝和凝聚相结合的策略实现了欠约束和完备约束系统的分解,使用解析法和数值法对约束进行求解。该策略已经在参数化CAD系统GEMS5.0的二维和三维上实现。  相似文献   

18.
首次在命题逻辑系统中引入理论的真度概念,使得真度的概念由公式的真度推广为公式集的真度,从而简化了发散度的概念;在逻辑系统Gn中讨论了理论Γ1、Γ2和Γ1∪Γ2的真度、相容度和发散度之间的关系。  相似文献   

19.
为了有效解决专利文献中术语抽取问题,提出采用字符串之间的结合强度融合词性过滤法抽取术语的方法.根据专利文献中术语出现的特点,提出了字符串之间的边界结合度方法和字符串之间的串边结合度方法,度量了字符串间的结合强度.在此基础之上,根据术语内部结构中词性的组成特点,提出了术语双字词性过滤的方法,并与结合强度的计算方法进行融合.实验结果表明,该方法对中文专利术语抽取有很好的效果,平均正确率为80.24%,平均召回率为80.61%.  相似文献   

20.
说明了概率逻辑学基本定理在多值R0、Gdel和Goguen命题逻辑系统中成立,给出了真度满足概率逻辑学基本定理的条件并对真度的性质进行了推广。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号