共查询到20条相似文献,搜索用时 125 毫秒
1.
针对现有加权关联规则挖掘算法不能适用于矩阵加权数据的缺陷,给出一种新的矩阵加权项集剪枝策略,构建矩阵加权正负关联模式评价框架SRCCCI,提出一种新的基于SRCCCI评价框架的矩阵加权正负关联规则挖掘算法MWARM-SRCCCI。该算法克服了现有挖掘技术的缺陷,采用新的剪枝技术和模式评价方法,挖掘有效的矩阵加权正负关联规则,避免一些无效和无趣的模式产生。以中文Web测试集CWT200g为实验数据,与现有无加权正负关联规则挖掘算法比较,MWARM-SRCCCI算法的挖掘时间减幅最大可达74.74%。理论分析和实验结果表明,MWARM-SRCCCI算法具有较好的剪枝效果,候选项集数量和挖掘时间明显减少,挖掘效率得到极大提高,其关联模式可为信息检索提供可靠的查询扩展词来源。 相似文献
2.
给出项权值变化的数据模型形式化表示, 构建新的加权项集剪枝策略及其模式评价框架SCCI (supportconfidence-correlation-interest), 提出基于项权值变化和SCCI 评价框架的加权正负关联规则挖掘算法. 该算法考虑了项权值变化的数据特点, 采用新的剪枝方法和评价框架, 通过项集权值简单计算和比较, 挖掘有效的加权正负关联规则. 实验结果表明, 该算法能够有效地减少候选项集数量和挖掘时间, 挖掘出有趣的关联模式, 避免无效模式出现, 挖掘效率高于相比较的现有算法, 解决了项权值变化的加权负模式挖掘问题.
相似文献3.
对海量教育信息化数据关联模式的挖掘与分析,有利于发现教育信息化数据中事先不知道的、但又是潜在有用的教育模式和知识,为教育管理、教育决策和教学改革提供科学的依据。研究面向教育信息化数据的完全加权负关联模式挖掘技术,提出一种新的教育信息化数据完全加权正负关联模式挖掘算法。该算法考虑了项目在事务数据库中的权值,从教育数据中挖掘完全加权频繁项集和负项集,在支持度-置信度-相关性架构下从频繁项集和负项集挖掘有趣的教育数据完全加权正负关联模式。通过模式分析,发现教育领域潜在的教育、教学规律和教育发展趋势,提高教育信息化数据分析和处理水平。以真实的教育信息化数据作为实验数据测试集,实验结果表明,与现有的正负模式挖掘算法比较,所提出的算法更有效、更合理,其挖掘出的正负关联模式更加接近现实。 相似文献
4.
完全加权数据模型的特点是其项目权值分布在各个事务记录中,随着事务记录的不同而变化。现有的加权负关联规则挖掘算法不能适用于完全加权数据模型。该文提出一种新颖的基于概率比和兴趣度的完全加权正负关联规则的挖掘算法,探讨了算法在教育信息化数据中的应用。算法以概率比代替传统的置信度,采用支持度-概率比-兴趣度架构衡量完全加权正负关联规则,获得很好的挖掘效果。以真实的教育数据和文本数据为实验测试集,与现有正负关联规则挖掘算法比较,该文提出的算法更有效、更合理,具有较高的理论价值和应用前景。 相似文献
5.
本文将互信息模型引入教育数据关联模式挖掘,提出一种基于互信息的教育数据矩阵加权正负关联模式挖掘算法,给出与其相关的定理及其证明。本文算法克服了现有挖掘算法的缺陷,考虑了教育数据项集在学生信息数据库中具有的权值,采用新的正负关联模式评价标准,挖掘出更接近实际情况的正负关联模式。通过关联模式分析,发现教育数据中潜在有用的教育、教学规律和教育发展趋势,为教育管理、教育决策和教学改革提供科学的依据。以真实的教育数据作为实验数据测试集,实验结果表明,本文算法有效,在教育信息化数据处理与分析中具有重要的应用价值。 相似文献
6.
为了将完全加权关联规则挖掘技术应用于查询扩展,提出面向查询扩展的基于多种剪枝策略的完全加权词间关联规则挖掘算法,该算法能够极大地提高挖掘效率;提出了一种新的查询扩展模型和扩展词权重计算方法,使扩展词权值更加合理,在此基础上提出一种新的基于局部反馈的查询扩展算法,该算法利用完全加权关联规则挖掘算法自动从局部反馈的前列初检文档中挖掘与原查询相关的完全加权关联规则,构建规则库,从中提取与原查询相关的扩展词,实现查询扩展。实验结果表明,查询扩展算法的检索性能确实得到了很好的改善和提高,与现有查询扩展算法比较,在相同的查全率水平级下其平均查准率有了明显的提高。 相似文献
7.
查询扩展是改善和提高信息检索性能的核心技术之一,其关键问题是如何获取与原查询相关的扩展词。通过关联规则挖掘技术获取扩展词是一种有效的扩展词来源方法。为了获取高质量的扩展词,提出了一种面向查询扩展的基于文本数据库的词间正负关联规则挖掘算法。该算法采用支持度-置信度-相关度框架衡量关联规则,避免产生自相矛盾的正、负关联规则,并结合查询项,给出新的剪枝策略,挖掘出只含有查询词项的正负规则,提高了挖掘效率。实验结果表明,与传统的挖掘算法比较,提出的算法更有效、合理,能检测和删除相互矛盾的规则。 相似文献
8.
针对交易数据库中数据项重要性不同的现象,引入加权支持度和最小支持期望的概念,提出一种基于关联图的加权关联规则模型,并在该模型基础上,设计了改进的加权关联规则挖掘算法。该算法扫描数据库仅一次,采用关联图存储频繁2项集信息,通过构建基于图的剪枝策略,减少验证频繁项集的计算量,有效提高加权频繁项集的生成效率。 相似文献
9.
在研究负关联规则相关特性的基础上,将向量内积引入到该领域,提出了一种基于向量内积的多最小支持度正负关联规则挖掘算法。考虑到事务数据库中各项集分布不均而导致的单一最小支持度难以设定的问题,采用了多最小支持度策略,设计了一种能同时挖掘出频繁与非频繁项集,以及从这些项集中挖掘出正负关联规则的算法。实验结果表明,该算法仅需扫描一次数据库,且具有动态剪枝,不保留中间候选项和节省大量内存等优点,对事务数据库中负关联规则的挖掘具有重要意义。 相似文献
10.
基于图的关联规则挖掘算法会产生大量候选项集。针对该问题,提出一种结合双向搜索策略的改进算法。按照支持度对频繁 1-项集排序,对频繁k-项集的最长超集进行验证,利用Apriori算法进行剪枝。实验结果表明,在支持度阈值较小时,改进算法能有效减少候选项集的数量,提高挖掘效率。 相似文献
11.
12.
13.
基于图的关联规则改进算法 总被引:1,自引:0,他引:1
黄红星 《计算机与数字工程》2009,37(12):38-41,162
关联规则挖掘是数据挖掘研究的最重要课题之一。基于图的关联规则挖掘DLG算法通过一次扫描数据库构建关联图,然后遍历该关联图产生频繁项集,有效地提高了关联规则挖掘的性能。在分析该算法基本原理基础上,提出了一种改进的算法—DLG#。改进算法在关联图构造同时构造项集关联矩阵,在候选项集生成时结合关联图和Apriori性质对冗余项集进行剪枝,减少了候选项集数,简化了候选项集的验证。比较实验结果表明,在不同数据集和不同支持度阈值下,改进算法都能更快速的发现频繁项集,当频繁项集平均长度较大时性能提高明显。 相似文献
14.
15.
关联规则挖掘是数据挖掘领域中的重要研究内容之一。然而,传统的基于支持度-可信度框架的挖掘方法可能会产生大量不相关、甚至是误导的关联规则。针对现有关联规则挖掘的评价标准存在的问题,提出在评价标准中增加兴趣度,并给出了兴趣度的定义和基于兴趣度的关联规则挖掘算法。利用兴趣度将关联规则分为正关联规则和负关联规则,从而可以用算法挖掘带有负项的关联规则。实验结果分析表明,在传统挖掘方法的基础上引入兴趣度,可以有效地减少正关联规则的规模,产生有意义的负关联规则。 相似文献
16.
一种有效的关联规则的挖掘方法 总被引:13,自引:1,他引:13
提出简单关联规则的定义,并证明传统算法挖出的规则集中的任何规则均可以由简单关联规则生成,而简单关联规则的数量远远小于传统算法挖掘出的规则数量,从理论上证明了简单关联规则算法的优越性。 相似文献
17.
针对关联规则之间存在的冗余性问题,已提出多种精简关联规则模型,但这些模型仍不同程度存在紧致度欠佳、信息丢失或恢复算法复杂的问题.提出了一种含更丰富关联信息的基本关联规则,并以基本关联规则为基础构建无损的精简关联规则集合,它是原始关联规则集合的子集,并能据此完全恢复原始关联规则集合.给出了基本关联规则模型的定义,证明了该精简模型的几个重要性质,并设计了用于挖掘该类规则的挖掘算法.实验表明,基本关联规则模型比现有的关联规则精简模型更加紧致. 相似文献
18.
关联规则挖掘是数据挖掘领域中的重要研究内容之一。然而,传统的基于支持度-可信度框架的挖掘方法可能会产生大量不相关、甚至是误导的关联规则。针对现有关联规则挖掘的评价标准存在的问题,提出在评价标准中增加兴趣度,并给出了兴趣度的定义和基于兴趣度的关联规则挖掘算法。利用兴趣度将关联规则分为正关联规则和负关联规则,从而可以用算法挖掘带有负项的关联规则。实验结果分析表明,在传统挖掘方法的基础上引入兴趣度,可以有效地减少正关联规则的规模,产生有意义的负关联规则。 相似文献
19.
在现有的机动目标跟踪算法中,其中的概率数据关联(PDA)算法和交互式多模型(IMM)算法最具代表性。而在此基础上发展而来的IMMPDA算法是解决杂波环境下单机动目标跟踪问题比较有效的方法。通过对分别基于CA模型、Singer模型和“当前”统计模型的交互式多模型概率数据关联(IMMPDA)算法进行仿真,对其优缺点进行对比分析。仿真结果显示IMMPDA算法在高机动目标跟踪中具有巨大优势,不同的:运动模型基于IMMPDA都较好地实现了对高速高机动目标的滤波跟踪。 相似文献