首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 93 毫秒
1.
关联规则挖掘是数据挖掘的一项重要技术,它主要是通过频繁闭项集挖掘得到关联规则。因此,频繁项集挖掘算法的性能对关联规则挖掘算法起到了决定性的作用。基于数据流的频繁闭项集挖掘能针对数据流有效地挖掘频繁闭项集,本文主要分析基于数据流的频繁闭项集挖掘算法及其在关联规则挖掘中的应用。  相似文献   

2.
Web日志挖掘是Web数据挖掘的一个重要研究领域。Web日志挖掘通过发现Web日志中用户的访问规律和模式,可以提取出其中潜在的规律和信息,人们对这个领域的研究也日益重视。然而,传统的基于关联规则的Web日志挖掘算法都是基于所有关联规则的。这种方式往往挖掘产生大量的候选规则,而且存在大量冗余的规则。提出了一种新的无冗余的Web日志挖掘算法,该算法通过引入频繁闭项集合最小关联规则的概念,从而解决了以往基于所有关联规则挖掘算法中出现的上述问题。  相似文献   

3.
文中首先描述了负关联规则的基本概念,接着分析了负关联规则挖掘的特点和相关算法,并提出基于相关性和剪切策略的改进算法来进行正、负关联规则挖掘,最后指出了负关联规则挖掘的研究方向.  相似文献   

4.
遗传算法在Web关联挖掘中的应用研究   总被引:3,自引:1,他引:2  
关联规则是描述Web用户行为特征的重要依据。传统的基于统计学的Web关联规则挖掘算法注重对现有数据的分析,不能针对Web关联挖掘的特点提供有效的预测手段和优化反馈措施。文章提出一种基于遗传算法的Web关联挖掘算法体系,实验证明它能弥补传统Web关联挖掘算法的不足,为Web关联挖掘提供了一种新的思路。  相似文献   

5.
当前关联规则挖掘主要着眼于正关联规则,如A→B的关联规则的挖掘,这种单一的只对正关联规则的挖掘方式存在严重的弊端,他掩盖了数据之间存在的隐含负关联规则,进而无法得出一些正关联规则中某些项目间相互制约的负关联关系。在关联规则概念和性质的基础上提出了基于频繁模式树的拓展式的正、负项目的关联规则挖掘算法,通过对数据库的遍历形成前缀链表,不仅挖掘包含所有正项目的关联规则,而且还能够挖掘出所有包含负项目的关联规则,不会造成负关联规则的淹没。并对算法的效率和可行性进行分析,该算法在描述关联规则项目间的相互独立程度上比已有的单一挖掘负项目的关联规则算法更具优势。  相似文献   

6.
通过对数据挖掘中聚类技术和关联规则挖掘技术的多种算法进行比较研究,提出了基于聚类的关联规则挖掘算法,阐明了具体聚类方法选择的依据,详述了该算法的实现过程,并利用该算法挖掘出校园卡用户消费行为之间简单的关联规则.  相似文献   

7.
以数据挖掘中的关联规则为基础,深入研究了个性化推荐系统的架构和推荐系统模型。针对传统关联规则挖掘算法在解决移动电子商务环境个性化推荐问题时反复扫描数据库,频繁项挖掘效率低,关联规则挖掘准确率低以及规则大量冗余等不足,采用基于事务矩阵和兴趣度的关联规则挖掘算法构建个性化的推荐系统模型,提升了个性化推荐质量。  相似文献   

8.
关联规则是捕述Web用户行为特征的重要依据。传统的基于统计学的Web关联规则挖掘算法注重对现有数据的分析,不能针对Web关联挖掘的特点提供有效的预测手段和优化反馈措施。本文提出一种基于遗传算法的Web关联挖掘算法体系,实验证明它能。弥补传统Web关联挖掘算法的不足,为Web关联挖掘提供了一种新的思路。  相似文献   

9.
随着信息技术和数据库技术的飞速发展,从大量的数据中获取有用的信息和知识变得越来越重要。模糊关联规则挖掘是数据挖掘中针对数量型属性关联规则发现的一种有效方法。提出了一种基于矩阵的模糊关联规则挖掘算法,并将其应用于网络安全事件关联分析中,通过对DARPA标准数据集的分析,得出了预期数量的关联规则,并成功验证了某些攻击场景,该模糊关联规则挖掘算法取得了较好的实验结果。  相似文献   

10.
通过分析电子商务网站的 Web 服务器日志提取网络消费者的商品浏览行为信息,利用消费者的浏览频率、浏览时间、链接路径数及路径深度估计商品对网络消费者当前浏览期间偏好的影响权重.结合双向关联规则理论和 Apriori 算法挖掘具有相互依赖关系的商品,找出网络消费者的商品偏好浏览路径,根据消费者当前的浏览行为发现其可能感兴趣的商品,并进一步计算消费者对商品的偏好程度.最后利用自主开发的旅游电子商务网站的Web 日志数据进行仿真实验,挖掘网络消费者的旅游偏好.实验结果表明,在相同的实验条件下,与基于关联规则的偏好挖掘方法相比,基于双向关联规则的偏好挖掘方法的推荐精度增加,推荐覆盖率扩大.  相似文献   

11.
数据挖掘是关联规则中一个重要的研究方向.对关联规则的数据挖掘和遗传算法进行概述,阐述关联规则数据挖掘的意义,提出一种采用改进型遗传算法的关联规则的提取算法,并从编码方法、适应度函数的构造和变异、选择、交叉算子设计方面进行讨论和分析,最后结合一个具体实例进行应用.实验证明这种算法是有效的.  相似文献   

12.
基于项权值排序挖掘的跨语言查询扩展   总被引:1,自引:0,他引:1       下载免费PDF全文
黄名选  蒋曹清 《电子学报》2020,48(3):568-576
为了改善自然语言处理应用中长期存在的主题漂移和词不匹配问题,本文首先提出一种加权项集支持度计算方法和基于项权值排序的剪枝方法,给出面向查询扩展的基于项权值排序的加权关联规则挖掘算法,讨论关联规则混合扩展、后件扩展和前件扩展模型,最后提出基于项权值排序挖掘的跨语言查询扩展算法.该算法采用新的支持度和剪枝策略挖掘加权关联规则,根据扩展模型从规则中提取高质量扩展词实现跨语言查询扩展.实验结果表明,与现有基于加权关联规则挖掘的跨语言扩展算法比较,本文扩展算法能有效遏制查询主题漂移和词不匹配问题,可用于各种语言的信息检索以改善检索性能,扩展模型中后件扩展获得最优检索性能,混合扩展的检索性能不如后件扩展和前件扩展,支持度对后件扩展更有效,置信度更有利于提升前件扩展和混合扩展的检索性能.本文挖掘方法可用于文本挖掘、商务数据挖掘和推荐系统以提高其挖掘性能.  相似文献   

13.
周秀梅  黄名选 《电子学报》2015,43(8):1545-1554
本文提出一种基于项权值变化的完全加权正负关联规则挖掘算法,解决了基于项权值变化的负模式挖掘问题.该算法考虑项权值依赖于事务记录的特点,采用新的项集剪枝方法和模式评价框架,通过项集的项内权值比和维数比的简单计算和比较,挖掘有效的完全加权正负关联规则.实验结果表明,与现有无加权正负关联规则挖掘算法比较,本文算法能避免无效的模式出现,其挖掘时间和候选项集数量明显减少,减幅最大分别可达94.09%和88.16%.  相似文献   

14.
提出了一种基于关联规则的数据挖掘算法,以此来获取CMMB网络优化的关键指标。首先介绍了关联规则数据挖掘技术;重点研究了CMMB网络分析系统的过程实现、数据库生成以及基于关联规则的数据挖掘算法Aprior的实现;最后结合实际数据给出了分析结果。  相似文献   

15.
针对传统关联规则可视化挖掘方法不利于处理多值属性数据、缺乏展现数据间的频繁模式和关联模式以及效率低下等问题,提出了基于KAF因子和CHF因子的Apriori改进算法进行多值属性关联规则挖掘,实现了一种新的基于概念格的多值属性关联规则可视化方法.运用概念格理论对多值属性数据进行了重新定义和分类,建立了较为完整的挖掘过程参数调整策略,方便用户选择关键属性值进行规则挖掘分析,提高了算法运行速度和挖掘效率.以概念格结构将多值数据组织起来,实现了对频繁项集的可视化展示,以及关联规则的多模式可视化展示.实验结果表明,改进后的挖掘算法具有更好的性能,所提出的可视化形式和已有成果相比具有良好的展现效果.  相似文献   

16.
Liao  Jiyong  Wu  Sheng  Liu  Ailian 《Wireless Personal Communications》2021,116(3):1639-1657

High utility itemsets mining has become a hot research topic in association rules mining. But many algorithms directly mine datasets, and there is a problem on dense datasets, that is, too many itemsets stored in each transaction. In the process of mining association rules, it takes a lot of storage space and affects the running efficiency of the algorithm. In the existing algorithms, there is a lack of efficient itemset mining algorithms for dense datasets. Aiming at this problem, a high utility itemsets mining algorithm based on divide-and-conquer strategy is proposed. Using the improved silhouette coefficient to select the best K-means cluster number, the datasets are divided into many smaller subclasses. Then, the association rules mining is performed by Boolean matrix compression operation on each subclass, and iteratively merge them to get the final mining results. We also analyze the time complexity of our method and Apriori algorithm. Finally, experimental results on several well-known real world datasets are conducted to show that the improved algorithm performs faster and consumes less memory on dense datasets, which can effectively improve the computational efficiency of the algorithm.

  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号