共查询到20条相似文献,搜索用时 15 毫秒
1.
在时间越近越重要原则指导下,对记录进行时间加权,通过给出加权的公式,提出了一种基于背景的加权关联规则挖掘方法。该算法可以针对用户感兴趣的时间-地点背景进行关联规则挖掘。相比传统挖掘方法,该方法通过从低层次到高层次概念的序列映射,可以分析出不同粒度层次的相关信息,有利于决策者做出更准确的决策分析,制定更优的策略。 相似文献
2.
一种基于矩阵的强关联规则生成算法* 总被引:5,自引:0,他引:5
针对Apriori算法扫描数据库的I/O代价和候选项集数目较多等问题,提出一种基于矩阵的强关联规则生成算法,算法通过将事务数据库转化为0-1矩阵后对项集按照支持度计数非递减顺序排列,从而减少候选项集的产生,同时实现置信度的高效计算。通过对实例和大数据量数据库的分析表明,该方法是有效的。 相似文献
3.
基于频繁模式树的分布式关联规则挖掘算法 总被引:1,自引:0,他引:1
提出一种基于频繁模式树的分布式关联规则挖掘算法(DMARF).DMARF算法设置了中心结点,利用局部频繁模式树让各计算机结点快速获取局部频繁项集,然后与中心结点交互实现数据汇总,最终获得全局频繁项集.DMARF算法采用顶部和底部策略,能大幅减少候选项集,降低通信量.理论分析和实验结果均表明了DMARF算法是快速而有效的. 相似文献
4.
针对关联规则挖掘应用所面临的困难,分析了XML语言的技术特点,提出了一种基于半结构化数据的关联规则挖掘模式。该模式充分利用了半结构化数据源的自描述性、开放性和可扩展性方面的优势。 相似文献
5.
基于粗糙集的关联规则挖掘方法 总被引:1,自引:0,他引:1
对粗糙集进行了相关研究,并提出一种以粗糙集理论为基础的关联规则挖掘方法,该方法首先利用粗糙集的特征属性约简算法进行属性约简,然后在构建约简决策表的基础上应用改进的Apriori算法进行关联规则挖掘。该方法的优势在于消除了不重要的属性,减少了属性数目和候选项集数量,同时只需一次扫描决策表就可产生决策规则。应用实例及实验结果分析表明该方法是一种有效而且快速的关联规则挖掘方法。 相似文献
6.
针对传统的关联规则可视化方法缺乏多模式关联规则展现形式、无法展示关联规则的内部信息以及分布情况、属性值重要程度突出不明显等问题,提出了基于超图的关联规则表示方法。首先,基于超图中BF-超边基础理论,给出了BF规则图的定义,并且设计了基于超图的一对一、一对多、多对一、多对多关联规则表示原型;接着,结合“沙漏”结构,设计了基于超图的关联规则可视化布局算法;然后,基于交互理论及其相关技术,设计并实现了交互式关联规则可视化系统。最后,以某省全员人口数据为基础,对算法进行了具体实现和分析。实验结果表明,所提出的可视化形式和已有成果相比具有良好的展现效果。 相似文献
7.
基于关联规则的Web文档分类 总被引:5,自引:2,他引:5
在现有的Web文档分类器中,有的分类器产生比较精确的分类结果,有的分类器产生更易解释的分类模型,但还没有分类器可以将两个方面的优点结合起来.有鉴于此,论文提出一种基于关联规则的Web文档分类方法.该方法采用事务概念,主要考虑两方面的问题:①在文档训练集中发现最优的词条关联规则;②用这些规则构建一个Web文档分类器.试验表明该分类器性能良好,训练速度快,产生的规则易于被人理解,而且容易更新和调整. 相似文献
8.
9.
10.
一种基于模糊关联规则挖掘的攻击识别系统 总被引:1,自引:0,他引:1
降低攻击识别中的漏报率和误报率是现在一个急需解决的问题。论文分析了攻击识别的需求与模糊关联规则挖掘的有关概念,并且以此为基础构建了一个攻击识别系统。该系统不但能够很好地满足攻击识别的要求,而且还能同时对异常攻击和滥用攻击进行识别,并且在很大程度上降低了攻击识别中的漏报率和误报率,极大地增强了信息系统的生存力。 相似文献
11.
12.
在数据挖掘领域,关联规则的挖掘和基于粗糙集理论抽取决策规则是两种截然不同的方法,但在统计意义下两种方法产生的规则基本相同。结合关联规则挖掘方法和粗糙集方法的优点,基于Apriori算法提出一种优化算法,获取具有一定支持度和可信度阈值且不产生冗余的决策规则,以提高粗糙集属性值约简算法的性能。 相似文献
13.
提出一种基于免疫原理的人工免疫算法,用于模糊关联规则的挖掘.该算法通过借鉴生物免疫系统中的克隆选择原理来实施优化操作,它直接从给出的数据中,通过优化机制自动确定每个属性对应的模糊集合,使推导出的满足条件的模糊关联规则数目最多.将实际数据集和相关算法进行性能比较,实验结果表明了所提出算法的有效性. 相似文献
14.
一种基于关系矩阵的关联规则快速挖掘算法 总被引:13,自引:0,他引:13
首先对关联规则挖掘问题进行了简单的回顾,然后应用关系理论思想,引入了项目可辨识向量及其“与”运算,设计了一种快速挖掘算法SLIG,将频繁项目集的产生过程转化为项目集的关系矩阵中向量运算过程。算法只需扫描一遍数据库,克服了Aprori及其相关算法产生大量候选集和需多次扫描数据库的缺点。实验证明,与Aprori算法相比,SLIG算法提高了挖掘效率。 相似文献
15.
基于矩阵的增量式关联规则挖掘算法 总被引:1,自引:1,他引:0
关联规则是数据挖掘的重要研究内容之一。针对数据库数据增加的同时最小支持度发生改变的关联规则更新维护问题,提出了一种基于矩阵的增量式关联规则挖掘算法IUBM。该算法采用简单的数组和位运算,在执行关联规则的更新时,既不用多次扫描数据库,也不产生庞大的候选项集。实例表明,该算法的时间复杂度和空间复杂度大大降低。 相似文献
16.
17.
关联规则挖掘主要用于发现事务数据集中项与项之间的关系,现有的关联规则挖掘算法多是挖掘一种静态的关联规则,实际上规则随着时间的推移可能会有很大变化,为规则建立元规则对其支持度和置信度变化趋势进行分析和预测,有利于进一步指导挖掘和决策。通过一个实例介绍了一种基于马尔可夫模型的预测和分析的元规则的具体方法,并通过与其他方法的对比说明它是一个合理的模型。 相似文献
18.
在对关联规则冗余问题产生机理分析的基础上,提出了针对于支持度阀值设置的惩罚函数和一个改进的遗传算法。该改进算法采用了频繁项分布、素因子编码、择偶和共享函数等新颖技术,使染色体总是能在频繁项密集区进行挖掘,从而对组合搜索空间进行了有效修剪。并且对事务进行了数值转换,有效地压缩了事务数据库存储空间,提高了运算速度。从实验效果来看,改进的挖掘方法在发现有价值规则的效率与精准率方面具有一定优势。 相似文献
19.
研究了采用并行算法挖掘关联规则的优化方案。在数据分发(DD)算法的基础上引入了改进的智能数据分发(IDD)算法;之后提出采用混和分发(HD)算法,该算法综合了计数分发(CD)和IDD算法的优点,简单而有效地解决了算法中非常重要的候选项目集在各个处理器节点之间的划分问题,尽可能使得各个节点负载平衡。最后,对IDD和HD算法的复杂度给出了较为详细的分析。 相似文献
20.
关联规则挖掘是数据挖掘中的一项核心任务,而由二元关系导出的概念格则是一种非常有用的形式化分析工具,它体现了概念内涵和外延的统一,反映了对象和特征间的联系以及概念间的泛化与例化关系。一个概念内涵与一个关联规则中的闭合项集可以一一对应。提出了一种新有基于概念格的关联规则挖掘算法Arca(Association Rule based Concept lAttice)。Arca算法通过概念矩阵构造部分概念格,使概念格中的每个概念对应一个闭合频繁项集。然后生成一些关联规则,在这些关联规则上通过定义了四个算子来生成了所有关联规则。 相似文献