共查询到20条相似文献,搜索用时 125 毫秒
1.
在分析研究关系数据库上关联规则挖掘现有方法的基础上,提出了一种基于结构化查询语言SOL的多值多层关联规则挖掘新方法.采用了一种新的根据概念分层的编码方法对多值属性进行离散化,然后利用SOL的查询语句,结合多值属性的编码,实现了关系数据库上的多层关联规则挖掘.实验表踢,该算法具有快速、有效、易开发等优点. 相似文献
2.
在分析研究关系数据库上关联规则挖掘现有方法的基础上,提出了一种基于结构化查询语言SQL的多值多层关联规则挖掘新方法。采用了一种新的根据概念分层的编码方法对多值属性进行离散化,然后利用SQL的查询语句,结合多值属性的编码,实现了关系数据库上的多层关联规则挖掘。实验表明,该算法具有快速、有效、易开发等优点。 相似文献
3.
基于多维数据模型的交叉层关联规则挖掘 总被引:3,自引:0,他引:3
多层关联规则是带有一定概念分层的关联规更哇,它描述了不同抽象级别上数据项之间的关联性,且不同级别上的关联性具有不同的指导意义.但目前已讨论的多层关联规则,大都局限于挖掘同一抽象层上数据项之间的关联,因而,针对这一问题,本文对已有的FP—Tree算法进行扩充和改进,实现了既能挖掘同一抽象层上也能挖掘不同抽象层上数据项之间关联性的多层关联挖掘算法,即交叉层关联规则挖掘算法FP—Tree*.同时,在算法实施之前,还结合多层关联挖掘本身的特点,对现有的数据存储结构进行改进,提出用字符序列对事务项编码的方法,从而简化了大量的数据预处理工作. 相似文献
4.
大型数据库中多层关联规则的挖掘算法 总被引:3,自引:0,他引:3
将基于垂直数据分布的关联规则的发现从单层概念扩展到多层概念,提出了自顶向下的、用等价类生成频繁项目集的发现算法,无需复杂的Hash数据结构。该算法减少了项目的匹配计算,提高了挖掘的效率。 相似文献
5.
由于分布环境的日益普遍并且需要结合使用者的实际要求对数据集按层次挖掘关联规则,故本文针对在分布式环境下基于项约束的关联规则挖掘和多层关联规则挖掘的特点,将交易表按概念层次进行编码。使用逐层迭代挖掘蓑略,结合CD算法和Direct算法提出一种在分布式环境下挖掘约束性多层关联规则的有效算法:MLACD算法。并通过实验验证该算法是正确有效的。 相似文献
6.
7.
本文研究了多层关联规则挖掘中在由低概念层泛化至较高概念层后出现的含重复项规则的问题。在当前最新的高效关联规则发掘算法(IM)基础上引入了“数量”概念,提出了一种用于挖掘含重复项规则的新算法,并对其性能进行了分析。 相似文献
8.
为了解决多值关联规则挖掘中忽视罕见且有价值的非频繁模式的问题,提出了一种新的多值关联规则挖掘算法-QCoMine.该算法引入了量化相关模式的概念,通过考察多值属性间互信息熵和全置信度,找到具有强信息关系的属性集进而产生规则.实验结果表明,由于在属性层和区间层进行了剪枝,因此缩减了搜索空间,提高了算法的性能,且得到更高置信度、更有价值的规则. 相似文献
9.
挖掘关联规则的任务是在给定交易集中,每个交易包含一个数据项集,关联发现函数作用在交易集上,返回各数据项集间存在的关系。现实世界中,普遍存在"多级"的概念,在许多应用中,数据项集之间有用的关联规则常常出现在相对较高的概念层中,但在较低概念层往往可以发现较特殊和专门的信息。文中给出了一个在多级概念层上交互挖掘关联规则的算法,并进行了讨论,实验结果表明此算法提高了数据挖掘的效率和速度,并减少了对系统资源的利用。 相似文献
10.
针对传统数据挖掘中的“尖锐边界”问题,采用将模糊理论和关联规则挖掘技术相结合的思想,在改进传统Apriori算法的基础上,结合多层关联规则挖掘的方法,提出了一种模糊多层关联规则挖掘算法。对模糊多层关联规则挖掘的基本概念进行了定义,详细描述了模糊多层关联规则挖掘算法。最后用Visual FoxPro6.0语言实现了该算法程序,通过交易数据库挖掘实验表明算法是有效的。 相似文献
11.
数据挖掘算法过程中对客户行为的实时性是分析客户网络消费行为的重要要素之一,但是Prefixspan数据挖掘算法挖掘过程中并未对此问题予以考虑,因此,在时间间隔序列模式概念的基础上,提出了一种基于时间间隔和点击量的Prefixspan改进算法。在该算法中,引人了频繁度和时间属性的概念,并加入了时间间隔和点击量等要素,从而使挖掘到的信息具有实时性的特点,并且提高了对挖掘对象的侧重性。通过实验验证,与原来的Prefixspan算法相比较后表明,改进算法用于具有时间特性的数据集时获得的挖掘结果更精确,挖掘效率得到了有效的提高。 相似文献
12.
k中心点聚类算法在层次数据的应用 总被引:2,自引:0,他引:2
刘金岭 《计算机工程与设计》2008,29(24)
探讨了近年来提出的聚类概念与聚类过程、k中心点聚类的算法,在此基础上提出了一种基于层次数据模型的k中心聚类的改进算法.该算法一方面针对层次变量提出了相关的中值点概念;另一方面对传统k中心点算法进行了改进.最后对改进算法的复杂度进行了分析,由分析结果得出改进算法要比传统k中心点算法每次迭代耗费时间略少,但在总耗费时间上远远小于k中心点算法,大幅度提高了算法的整体性能. 相似文献
13.
14.
15.
萤火虫算法是一种基于生物群智能的仿生优化算法,具有概念简明、需要设置的参数少、容易实现等特点。但标准萤火虫算法容易陷入局部最优,尤其是针对高维优化函数时更甚。文献[1]提出了一种基于对偶和维度的改进算法,在种群初始化和算法迭代等方面给出了改进。基于维度加权的方法对文献[1]中提出的算法给出新的改进。算法综合考虑了当前最优萤火虫信息和部分萤火虫信息。实验结果的比较表明,改进后的算法体现了较为突出的优越性。 相似文献
16.
基于n阶形式背景核的概念格同构生成是一种新的概念格获取方法.其中n阶形式背景核的构造是基础.根据n阶形式背景核的概念,提出了n阶形式背景核的基本算法,并通过限制冗余形式背景的生成,对算法进行了改进.最后经过实验,验证了改进算法相对基本算法效率更高. 相似文献
17.
18.
提出一种基于改进的k-means算法的图像标注和检索方法。首先对训练图像进行分割,采用改进的k-means算法对分割后的区域进行聚类。改进的k-means算法首先采用遗传聚类算法确定聚类数k,然后对聚类中心进行选择。在图像标注时,首先通过已标注的图像求出语义概念和聚类区域的关联度,用它作为待标注图像的先验知识,然后结合区域的低层特征,对未标注的图像进行标注。在一个包含1 000幅图像的图像库进行实验,采用标注的语义关键字进行检索,结果表明,提出的方法是有效的。 相似文献
19.
20.
针对粒子群算法(PSO)的早熟收敛现象,从种群多样性出发,基于自组织临界性特点改进PSO 算法的参数设置,采用自组织的惯性权重和加速系数,并增加了变异算子。借鉴交换子和交换序概念,设计出了能直接在离散域进行搜索的改进的自组织PSO算法。用于旅行商问题(TSP)的求解,并与基本及其他典型改进PSO算法进行性能比较。实验结果证实改进的自组织PSO算法是有效的。 相似文献