首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 140 毫秒
1.
近年来,随着我国计算机网络的不断普及,数据库在各个领域中的应用也越来越广泛。而关联规则发现也逐渐成为数据库中知识发现研究的重点课题之一。当前,在大多数研究中,都是按照数据库中各项目平等一致的方式进行处理的。但是现实的数据库却并非如此,各个不同的项目其重要性也都不相同。为使其重要性得以充分反映,可对项目引入权值。基于此点,本文就数据库中加权关联规则的发现进行浅谈。  相似文献   

2.
频繁项集的挖掘是关联规则挖掘中一个关键的问题,典型的关联规则挖掘算法都是以数据库的多次扫描来实现的,而且不能即时反映数据库的变化,且其频繁项集的产生都只考虑了项目在数据库中出现的频度而没有考虑项目的重要性。本文提出了一种基于频繁链表的完全加权项频繁集的挖掘算法,该算法不但能动态反映数据库的变化,而且在频繁集的挖掘中只需扫描一次数据库,并根据项目的重要性程度对项目赋予了一定的权值,用以挖掘人们更感兴趣的关联规则。  相似文献   

3.
关联规则挖掘的应用日益广泛,但已经提出的大多关联规则挖掘算法都是把数据仓库中各个项目按平等一致的方式加以处理的.然而,在现实世界中,不同的项目往往有着不同的重要性.现有的有关加权关联规则的研究中,大多采用的加权方法不太好,或挖掘算法效率不够高.为此,提出了一种新的挖掘加权关联规则的算法,该算法采用矩阵和位串技术,只需要对数据库扫描一遍,可快速挖掘出所有的加权频繁项集,并且存放辅助信息所需要的空间也较少.研究表明该算法比已有的算法更高效.  相似文献   

4.
向量空间模型中完全加权关联规则的挖掘   总被引:9,自引:1,他引:9  
项目加权关联规则挖掘是通过对具体项目赋予一定的权值来挖掘人们更加感兴趣的关联规则,其中具体项目的权值在数据库中是固定不变的。但现实数据库中,存在着所有项目权值会发生变化的问题。针对此类问题,文章提出新的加权关联规则模型,并提出了完全加权关联规则的挖掘算法。实验结果表明该算法是有效的。  相似文献   

5.
关联规则挖掘作为近年来的研究热点之一,其经典算法Apriori算法因需要多次扫描数据库且会产生大量候选项集,严重影响了关联规则的挖掘效率.在此基础上提出了一种基于矩阵压缩的加权关联规则挖掘算法,只需扫描一次数据库,并将其转换为0-1矩阵,根据相关性质对矩阵进行压缩,从而降低了算法执行过程中的计算量;同时,考虑到项目的重要性,采取加权的方法,用求概率的方式设置项目属性的权值.同Apriori算法相比,本算法在挖掘过程中能直接查找高阶频繁项集.实验结果表明,本算法能有效提高关联规则的挖掘效率.  相似文献   

6.
结合增量更新算法,为不同时间段内的数据赋予不同的权值,通过引入最小支持数阈值及其自适应调整方法,提出一种加权增量关联规则挖掘算法Apriori+。算法中反映客观规律的时间权值使项集的频繁性在增量情况下具有时变特性,因此挖掘出的关联规则更符合实际需要。  相似文献   

7.
陈文 《计算机工程》2010,36(13):59-61
针对交易数据库中数据项重要性不同的现象,引入加权支持度和最小支持期望的概念,提出一种基于关联图的加权关联规则模型,并在该模型基础上,设计了改进的加权关联规则挖掘算法。该算法扫描数据库仅一次,采用关联图存储频繁2项集信息,通过构建基于图的剪枝策略,减少验证频繁项集的计算量,有效提高加权频繁项集的生成效率。  相似文献   

8.
数据挖掘过程中只考虑数据项权重或者只考虑时态语义会导致挖掘结果不全面。针对该问题,对加权关联规则、时态关联规则和时态数据周期规律进行研究,将权值、K-支持期望和周期等概念引入到时态关联规则中,提出一种基于周期规律的加权时态关联规则挖掘算法。以某管理系统审计数据为例进行实验验证,结果表明该算法能够准确地挖掘出数据库中的加权时态关联规则,与加权关联规则算法相比,在时间复杂度相同的情况下能使关联规则的挖掘结果更加全面。  相似文献   

9.
发现频繁项目序列集是关联规则挖掘中的一个重要步骤.该文提出两个发现最大频繁 项目序列的算法Dfis和Dfisp.Dfis算法基于项目序列集操作理论,只有一次数据库扫描.Dfisp 是Dfis的改进算法,它引入数据分割技术以提高内存使用率因而增强对大型数据库的处理能力, 是一个两次数据库扫描算法.实验表明了它们的性能和优势.  相似文献   

10.
针对数量型关联规则挖掘中划分边界过硬问题,以及加权关联规则中为确保向下封闭性成立而引起的规则丢失问题,提出一种新的加权模糊关联挖掘模型及其挖掘算法 NFWARM.为了避免区间划分引起的边界过硬问题,该模型引入模糊集软化属性的划分边界;同时,使用属性权重刻画元素对规则的贡献,在保证频繁项集向下封闭性的情况下,不会引起规则丢失.实验结果表明,该算法适用于包含布尔型和数值型数据的大型数据库的规则挖掘,并且得到的频繁项目集数目和规则数目有显著增加.  相似文献   

11.
加权关联规则的改进算法   总被引:7,自引:2,他引:7  
论文讨论了加权关联规则问题,针对布尔类型的加权关联规则问题提出一种改进算法。该算法首先利用普通的关联规则算法产生频繁集,然后在该频繁集的基础上产生加权频繁集。同时,给出了最优的最小支持度设定方法,保证了普通关联规则算法所产生的频繁集为加权频繁集的超集。该算法有较高的效率,并且能够有效利用已有的关联规则算法。  相似文献   

12.
加权关联规则算法存在2个不足:(1)不满足向下封闭性要求,即频繁集的子集未必是频繁集;(2)加权关联规则不能很好地处理不同项目的不同重要性,真正地体现不同项目重要性的不同。针对上述问题,提出一种动态加权关联规则算法,算法根据项目的重要性和最大频繁项目集数量确定项目不同阶段的不同权重,充分体现不同项目的重要性是不同的,从而使算法的向下封闭性得到证明。实验结果表明,该算法具有较高的准确性及效率。  相似文献   

13.
关联规则挖掘算法在实际应用中存在如下假设,即假定每个属性的重要性相同.因此,将其应用于入侵检测时,很可能挖掘出大量无用规则,甚至是误导的规则.为了解决该问题,在引入加权支持度的基础上,提出一种加权频繁项集算法,将该算法应用于网络连接记录的挖掘中.实验结果表明,该算法有效、可行.  相似文献   

14.
传统的关联规则挖掘研究事务中所包含的项与项之间的关联性,而负关联规则挖掘不仅要考虑事务中包含的项,还要考虑事务中不包含的项。给出了完全负关联规则的定义,提出一种基于树的算法Free-PNP,通过此算法挖掘数据库中的负频繁模式,继而得到所要挖掘的完全负关联规则。通过实验验证了算法的有效性。  相似文献   

15.
The mining frequent itemsets plays an important role in the mining of association rules. Frequent itemsets are typically mined from binary databases where each item in a transaction may have a different significance. Mining Frequent Weighted Itemsets (FWI) from weighted items transaction databases addresses this issue. This paper therefore proposes algorithms for the fast mining of FWI from weighted item transaction databases. Firstly, an algorithm for directly mining FWI using WIT-trees is presented. After that, some theorems are developed concerning the fast mining of FWI. Based on these theorems, an advanced algorithm for mining FWI is proposed. Finally, a Diffset strategy for the efficient computation of the weighted support for itemsets is described, and an algorithm for mining FWI using Diffsets presented. A complete evaluation of the proposed algorithms is also presented.  相似文献   

16.
一种新的加权关联规则模型   总被引:5,自引:3,他引:5  
关联规则挖掘可以发现大量数据项集之间隐含的关系,在许多领域得到了广泛应用。目前很多关联规则挖掘算法已经被提出,这些算法一般都认为每个数据项的重要性相同。然而在现实中各个项目的重要性往往不同,从决策者角度出发,他们往往会优先考虑利润较高的项目,而忽略利润较低的项目。论文分析了现有加权关联规则文献中存在的问题,提出了一种新的加权关联规则模型,给出了有效挖掘加权频繁项集的MWFI算法。  相似文献   

17.
加权关联规则的开采   总被引:24,自引:0,他引:24  
关联规则可以揭示数据之间隐含的关系,并已在许多领域取得了广泛的应用。目前已经提出了许多有效发现关联规则的算法,这些算法都认为每个数据对规则的重要性相同。但在实际应用中,用户更关心近期发生的数据,即历史越久远的数据对规则的影响应该小,应当削弱这些数据对规则的影响,为此,本文提出了垂直加权关联规则的问题;另外,用户有时可能希望加强或削弱某些项目对规则的影响,即所谓的水平加权关联规则。最后,提出了混合加权关联规则的问题,并给出了一个解决该问题的算法MWAL,实验证明了MWAL算法的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号