首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 234 毫秒
1.
一种基于用户指导的多关系关联规则挖掘算法   总被引:1,自引:0,他引:1  
提出一种基于用户指导的多关系关联规则挖掘算法,对传统的关联规则挖掘方法进行拓展,借鉴元组ID传播的思想使多表间无需物理连接而能直接进行关联规则挖掘,并引入了用户指导的概念,提高了用户的满意程度及挖掘的效率和精确度.该算法能够直接支持关系数据库,且运行时间远远小于基于ILP技术的多关系关联规则挖掘算法.  相似文献   

2.
DNS访问记录体现了网络用户的访问意图,通过Apriori关联规则挖掘算法处理这些记录,生成关联规则用以发现网络用户的访问行为模式,从而满足用户识别、用户分析等应用需求。该文详细分析了Apriori关联规则挖掘算法,针对其不足进行改进,应用于DNS访问记录挖掘中,对产生的关联规则进行了分析,得到相关用户的一些访问行为模式。  相似文献   

3.
1引言 关联规则是数据挖掘领域中的一个重要课题,挖掘关联规则的算法已经有很多,比较重要的有Rakesh Agrawal等提出的Apriori算法[3],Ramakrishnan Srikant等提出的挖掘定量关联规则的算法,Sergey Brin等提出的DIC算法[5].这些算法都是离线的或者批处理式的,Christian Hidber提出了挖掘关联规则找出数据项频集的在线算法Carma,CharuC.Aggarwal提出了根据数据项频集的集合找出关联规则的在线算法[2],在线挖掘关联规则的算法允许用户随时调整最小支持度(阈值),如果中间结果已经令人满意,用户也可以随时终止算法的执行.  相似文献   

4.
本文提出了一种基于用户指导的多关系关联规则挖掘算法,借鉴有向图的概念动态的选择最优关键表,并利用元组ID传播的思想使多表间无需物理连接而能直接进行关联规则挖掘,同时引入用户指导的概念,提高了用户的满意程度及海量数据挖掘的效率和精确度,该算法能够直接支持关系数据库,且运行效率远远高于基于ILP技术的多关系关联规则挖掘算法,  相似文献   

5.
有趣Web日志关联规则挖掘算法   总被引:1,自引:0,他引:1  
对Web日志关联规则挖掘算法进行了研究,普通的关联规则挖掘算法发现的规则数量太多,里面含有大量用户不感兴趣的规则,规则知识很难为用户所使用.根据网站拓扑结构和矩阵迭代技术实现了一种有趣关联规则(IMIA)算法,能够快速迭代求解任意两个页面间的关联概率,对关联规则进行有趣度评价,得出有趣度高的规则.实验结果表明,该算法是有效的,可以进一步改善网站性能,提高智能服务质量和性能,从而很好地应用到电子商务领域.  相似文献   

6.
约束关联规则的增量式维护算法   总被引:6,自引:0,他引:6  
关联规则的挖掘是一个重要的数据挖掘问题,在关联规则的挖掘过程中加入约束条件,是实现用户参与挖掘的一种方式。在有约束的关联规则挖掘过程中,用户会不断调整约束条件,并要求更新挖掘结果。针对这种情况,提出了约束关联规则的增量式维护算法Separate_M,当约束条件发生变化时,在原有挖掘结果的基础上实现增量式更新,较重新运行Separate算法而言,减小了搜索空间,节约了时间,提高了挖掘效率。  相似文献   

7.
在约束关联规则挖掘过程中,影响交互的制约因素是挖掘算法的执行时间。为了提高挖掘过程的交互性,文章提出一种基于两阶段的约束关联规则挖掘算法。算法利用已挖掘的关联规则,实现约束关联规则的挖掘过程。在算法实现的过程中对关联规则集存储结构进行了优化,并扩展了类SQL查询语句。实验结果表明,由于在约束条件挖掘的过程中不需要再对数据库进行挖掘处理,节省了大量的用户时间,因此算法是有效的。  相似文献   

8.
空间关联规则挖掘可应用于发现空间数据库中大量空间谓词与非空间谓词之间的特定空间关系。论文针对区县道路交通数据提出了一种基于多最小支持度的空间关联规则挖掘算法,并给出了在GIS中进行空间关联规则挖掘的一般方法和流程。该挖掘算法可以从城市道路地理信息数据库中发现用户感兴趣的空间关联规则,经实际应用于城市道路规划管理系统,证明该算法是有效、可行的。  相似文献   

9.
基于多最小支持度的空间关联规则发现   总被引:5,自引:0,他引:5  
吴安阳  赵卫东 《计算机应用》2005,25(9):2171-2174
空间关联规则挖掘可应用于发现空间数据库中大量空间谓词与非空间谓词之间的特定空间关系。论文针对区县道路交通数据提出了一种基于多最小支持度的空间关联规则挖掘算法,并给出了在GIS中进行空间关联规则挖掘的一般方法和流程。该挖掘算法可以从城市道路地理信息数据库中发现用户感兴趣的空间关联规则,经实际应用于城市道路规划管理系统,证明该算法是有效、可行的。  相似文献   

10.
传统关联规则挖掘得到的原始规则集包含大量的、杂乱的规则,其中很多是冗余的,这样的规则集难以被用户理解和应用.针对这一问题,提出了一种基于确定性方法的关联规则挖掘新算法.该算法将专家系统中常用的确定性因子作为关联规则挖掘中的一个评价标准,并综合考虑了规则前件对后件的支持程度.实验结果表明,算法可发现规模较小的关联规则,并且提高了挖掘结果的可理解性.  相似文献   

11.
在挖掘空间拓扑关联规则时,由于现有挖掘算法不能够提取满足用户特定需求的空间拓扑关联规则,若使用传统约束性关联规则挖掘算法,则存在大量的重复计算和冗余候选项;提出一种面向用户的空间拓扑关联规则挖掘算法,其适合在多空间关系模式下,挖掘满足用户特定需求的拓扑关联。该算法通过拓扑关系编码法将空间关系事务转换成整数,用非目标自由空间对象类的集合序列数值递增的方法,索引构建候选频繁项,并用布尔运算计算支持数。在挖掘满足用户特定需求的空间拓扑关联规则时,该算法是快速而有效的。  相似文献   

12.
关联约简由Dominik首次提出,其采用粗糙集理论属性约简思想,从全局属性依赖的角度,挖掘出信息系统中所隐含的关联规则。由于求取给定信息系统所有关联约简和最优关联约简已被证明为NP-难问题,针对特定属性(事务)给出了两类关联约简构造性算法:Multi-Single算法和Single-Multi算法,从而挖掘出针对特定事务的关联规则,有益于综合评价各事务在信息系统中的作用。实例分析表明了所提算法的有效性。  相似文献   

13.
Shared-nothing并行事务数据库系统中规则的挖掘与更新算法   总被引:1,自引:0,他引:1  
关联规则是数据挖掘中的一个重要研究内容.本文提出了Shared—nothing并行事务数据库系统(简称SNPDBS)中一种快速的关联规则挖掘算法SNPMAR,并考虑当最小支持度发生变化后SNPDBS中关联规则的高效更新问题,提出了一种有效的关联规则更新算法SNPIUA.  相似文献   

14.
数据挖掘算法在入侵检测系统中的应用*   总被引:3,自引:1,他引:2  
数据挖掘可以利用各种分析工具从海量数据中发现模型和数据间的关系并做出预测。针对入侵检测系统的特点,将关联规则算法与序列模式算法应用于入侵检测系统中,介绍了将适当改进的关联规则Apriori算法与序列模式GSP算法相结合挖掘原始审计数据中频繁模式的过程,并着重研究了这两种算法结合扩展关联规则的算法应用。  相似文献   

15.
在语句语义相似度计算的算法中,没有考虑语句中的不同词语对语句之间相似度值的不同贡献程度,以致计算结果不理想。为此提出了基于频率函数的改进词语相似度算法,该算法将词语在语料库中的频率函数作为权重值,引入至语句的词语相似度计算中,以降低高频率词语在语句相似度值中的比重,提高算法精确率。由于当前审计方法存在散、乱、重复等现象,为了更好地复用已有的审计方法,将根据审计方法建立审计规则库,在此基础上,利用上述改进的语义相似度算法,计算用户输入与审计规则之间的相似度值,返回满足相似度阈值条件的审计规则所对应的审计方法,用户根据所返回的审计方法,选择合适的审计方法进行审计工作。实际应用表明,该算法的应用减少了人工搜索审计方法的时间,提高了审计效率。  相似文献   

16.
曾安平 《计算机应用》2012,32(8):2198-2201
针对传统关联规则算法产生的规则关联性弱、种类少的缺点,结合Spearman秩相关系数,提出了一种多类关联算法。该算法在传统算法产生的强规则基础上,利用Spearman秩相关方法计算出规则中产品间的同步异步等相关性。将其作为兴趣度阈值,算法可同时产生同步正规则、异步正规则、同步负规则和异步负规则四类关联规则,且规则间联系紧密。实验结果表明了算法的有效性和优越性。  相似文献   

17.
CAIM discretization algorithm   总被引:8,自引:0,他引:8  
The task of extracting knowledge from databases is quite often performed by machine learning algorithms. The majority of these algorithms can be applied only to data described by discrete numerical or nominal attributes (features). In the case of continuous attributes, there is a need for a discretization algorithm that transforms continuous attributes into discrete ones. We describe such an algorithm, called CAIM (class-attribute interdependence maximization), which is designed to work with supervised data. The goal of the CAIM algorithm is to maximize the class-attribute interdependence and to generate a (possibly) minimal number of discrete intervals. The algorithm does not require the user to predefine the number of intervals, as opposed to some other discretization algorithms. The tests performed using CAIM and six other state-of-the-art discretization algorithms show that discrete attributes generated by the CAIM algorithm almost always have the lowest number of intervals and the highest class-attribute interdependency. Two machine learning algorithms, the CLIP4 rule algorithm and the decision tree algorithm, are used to generate classification rules from data discretized by CAIM. For both the CLIP4 and decision tree algorithms, the accuracy of the generated rules is higher and the number of the rules is lower for data discretized using the CAIM algorithm when compared to data discretized using six other discretization algorithms. The highest classification accuracy was achieved for data sets discretized with the CAIM algorithm, as compared with the other six algorithms.  相似文献   

18.
谷波  李茹  刘开瑛 《计算机科学》2010,37(1):229-232
在自然语言处理中,句法分析主要有基于统计的方法和基于规则的方法。Earley算法是一种基于规则的方法,可以分析任意上下文无关文法(CFG),而不需要对文法进行修改。详细分析了Earley算法的特点。在通常的Earley算法中增加了多种预测机制,这些预测机制借鉴了LL,LR以及SLR等确定性分析算法的一些思想,并对这几种不同的预测机制及其组合在相同条件下进行了中文句法分析实验。结果显示,引入这些预测机制通常可以减少产生项目的数量,从而节省存储空间,减少运行时间。  相似文献   

19.
一种挖掘带否定关联规则的算法   总被引:4,自引:0,他引:4       下载免费PDF全文
关联规则挖掘算法的研究主要集中在提高Aptiori算法的效率上,而对带否定项关联规则的研究比较少。本文分析了目前带否定关联规则的两种基本算法,并在这两种基本算法的基础上进行改进。提出了一种新的挖掘算法。这种算法减少了在数据库中进行扫描计数的候选集个数,对于提高挖掘带否定关联规则的效率有一定的意义。  相似文献   

20.
典型Apriori改进算法的分析与比较   总被引:1,自引:0,他引:1  
Apriori算法是一种最有影响的挖掘布尔关联规则频繁项集的算法。为了提高算法的效率,国内外数据挖掘领域的专家、提出了一系列的改进策略。文章首先分析了Apriori算法及当前主要的改进算法,其次比较了这些算法的改进策略及其局限性,最后在此基础上提出了Apriori算法的未来研究方向。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号