共查询到20条相似文献,搜索用时 906 毫秒
1.
当前关联规则挖掘主要着眼于正关联规则,如A→B的关联规则的挖掘,这种单一的只对正关联规则的挖掘方式存在严重的弊端,他掩盖了数据之间存在的隐含负关联规则,进而无法得出一些正关联规则中某些项目间相互制约的负关联关系。在关联规则概念和性质的基础上提出了基于频繁模式树的拓展式的正、负项目的关联规则挖掘算法,通过对数据库的遍历形成前缀链表,不仅挖掘包含所有正项目的关联规则,而且还能够挖掘出所有包含负项目的关联规则,不会造成负关联规则的淹没。并对算法的效率和可行性进行分析,该算法在描述关联规则项目间的相互独立程度上比已有的单一挖掘负项目的关联规则算法更具优势。 相似文献
2.
基于支持度-置信度框架的负关联规则研究 总被引:1,自引:1,他引:0
基于支持度-置信度框架的关联规则存在一些缺陷,它可能产生负关联规则,而这种负关联规则又不容易被发现.实际上负关联规则对于实际应用上的研究很有价值.文中给出了一种负关联规则的判断方法并提出了一种挖掘负关联规则的算法. 相似文献
3.
关联规则挖掘是数据挖掘和知识发现中一门重要技术,但基于支持度-置信度框架的关联规则挖掘存在一些问题。文章引入了双向关联规则的概念,实现了基于遗传算法的双向关联规则挖掘算法。实验证明,它能弥补传统关联规则挖掘算法的不足。 相似文献
4.
在分布式系统中如何挖掘关联规则是研究数据挖掘方面的重要课题之一。在分布式系统中的关联规则通信方面,本文进行了关联规则的建立等问题进行了探讨,提出一种新的建立关联规则的算法ARDR,主要表现在通信方面和关联规则完整性方面有一定的优化。 相似文献
5.
介绍了关联规则数据挖掘概念和可拓学思想。探讨了把可拓学理论用于关系数据库上关联规则挖掘。通过对关系数据库上多值属性进行布尔数值转换,利用关联规则挖掘算法在关系数据库对关联规则进行挖掘.再用可拓学相关性和蕴含性思想,对所获得的关联规则进行拓展,获得更多更有价值的关联规则。 相似文献
6.
7.
文中首先描述了负关联规则的基本概念,接着分析了负关联规则挖掘的特点和相关算法,并提出基于相关性和剪切策略的改进算法来进行正、负关联规则挖掘,最后指出了负关联规则挖掘的研究方向. 相似文献
8.
9.
10.
利用加权关联规则方法提取护理人员职场偏差行为问卷研究中的规则,样本包括539名护理人员.鉴于偏差行为影响因素重要性的不一致,基于传统的关联规则Apriori算法,设计并实现了加权关联规则的挖掘算法,应用于护理人员偏差行为的研究.实验表明,与Apriori算法相比,加权关联规则方法提取出更多的规则,并且可以增强某些规则的支持度和置信度,使这些规则更容易被发现,说明该方法是可行的. 相似文献
11.
关联规则挖掘是数据挖掘研究的一个重要分支,其目的是为了发现大量数据中项目集之间感兴趣的相关性信息。经过十余年的发展,关联规则挖掘已经成为数据挖掘技术中较为成熟并很重要的一种方法,涉及到多种关联规则挖掘算法。文章重点介绍Apriori算法和FP—tree算法的基本思想、实现流程及其优缺点。 相似文献
12.
挖掘最大频繁项目集是数据挖掘中的重要研究课题。目前已经提出的最大频繁项目集挖掘算法大多是基于单机环境的,在分布环境中挖掘最大频繁项目集的算法尚不多见。文章提出了一种基于分布数据库的并行挖掘最大频繁项目集的算法。该算法尽可能地让每个处理器独立地挖掘,采用频繁模式树(FP—tree)作为数据结构,可方便地从各局部FP-tree中挖掘局部最大频繁项目集及判断各项目集的支持度。采用传递候选最大频繁项目集的方法。实验表明该算法是有效的并行算法。 相似文献
13.
基于图结构的挖掘是数据挖掘的新的研究方向,根据相关内容定义了用图表示两个有关文献引用关系的概念,提出了用图挖掘解决文献间相似关系的衡量与解决方法,目的在于找寻以文献为结点构造的图形中结点和结点之间的相互关系,进而反映出文献和文献之间的相似关系与文献的权威度。将图挖掘技术应用在文献引用关系方面,并提出了比较新颖的挖掘算法,此算法适合于以文献为结点构造的有向无环图,并为将来继续研究此方向打下了基础。所得结论将在图挖掘理论研究和网络搜索引擎方面具有很高的实用价值。 相似文献
14.
最大频繁项集的高效挖掘 总被引:11,自引:5,他引:6
提出了一种基于布尔矩阵的最大频繁项集挖掘算法MBA(Mining Boolean Array for maximal frequent itemsets),通过将FP-tree映射成布尔矩阵和权值表,运用布尔逻辑运算进行矩阵投影操作得到最大频繁项集。运算效率得到很大提高。 相似文献
15.
ZHAO Tai-fei YU Hong-fang LI Le-min 《光电子快报》2006,2(6):445-448
Pre-configuration Cycle (p-cycle) is a promising ap-proach for protecting working capacities in WDMnet-works because of its ability to achieve ring-like recoveryspeed while maintaining the capacity efficiency of amesh-restorable network[1].The first and t… 相似文献
16.
针对经典的快速区域卷积神经网络(Faster RCNN)训练过程存在太多难训练样本、召回率低等问题,该文采用一种基于在线难分样本挖掘技术(OHEM)与负难分样本挖掘(HNEM)技术相结合的方法,通过训练中实时筛选的最大损失值难分样本进行误差传递,解决了模型对难分样本检测率低问题,提高模型训练效率;为更好地提高模型的召回率和模型的泛化性,该文改进了非极大值抑制(NMS)算法,设置了置信度阈值罚函数,又引入多尺度、数据增强等训练方法。最后通过比较改进前后的结果,经敏感性实验分析表明,该算法在VOC2007数据集上取得了较好效果,平均精度均值从69.9%提升到了74.40%,在VOC2012上从70.4%提升到79.3%,验证了该算法的优越性。 相似文献
17.
张辉 《信息技术与信息化》2005,(4):111-113
数据挖掘技术是近年来数据库和人工智能领域研究的热点课题,目前在很多领域已有研究,但在公安刑侦工作的研究中尚处于初级阶段。本文对数据挖掘技术进行了研究,针对传统的分类规则-Apriori算法在刑侦工作中存在的问题进行了分析,提出了算法的改进,并通过模型进行了验证。 相似文献
18.
最大频繁序列挖掘是数据挖掘的重要内容之一.在深入分析频繁序列特点以及已有序列挖掘算法的基础上,提出一种新的最大序列挖掘算法Huffman-MaxSeq.与传统的"候选最大频繁序列集生成——测试"思路不同,该算法采用"边生成候选序列边测试"的思想,从而有效地减少了候选序列的生成.该算法基于构造哈夫曼树(最优树)的方法,对每个序列赋予权值,按权值的大小选取序列,连接生成新的候选频繁序列,再产生最大频繁序列. 相似文献
19.
关联规则挖掘是数据挖掘研究领域中的一个重要的方法,旨在挖掘事务数据库中有趣的模式。阐述了Web日志挖掘和关联规则的基本内容,分析了经典Apriori算法的不足之处,提出了改进的算法。另外,利用论坛Web日志数据进行了对比实验,实验结果表明改进后的算法性能有较大提高。将改进后的算法应用于网络论坛的日志挖掘,找出用户的个性化访问模式,从而提高论坛的服务质量。 相似文献
20.
在对数据挖掘技术和电子商务推荐系统进行研究的基础上,设计和提出了一种基于聚类算法的图书推荐系统,并将其应用到网上书店中,该系统在找近邻之前对所有资源进行聚类,缩小了找近邻的范围,从而大大提高了系统的运行效率,在实际应用中取得了较好的推荐效果。 相似文献