共查询到20条相似文献,搜索用时 125 毫秒
1.
由于进行关联规则挖掘过程中会产生大量规则,给关联规则的后期分析与利用带来了巨大障碍.针对关联规则的特点,提出了一种新的规则相似性度量方法,通过相似性度量方法推出新的规则距离度量方法,运用系统聚类中的类平均法进行聚类.实验结果表明,该距离度量方法考虑了关联规则的整体信息,依据聚类谱系图和规则散点图,确定了类和类的个数,有利于规则的分类处理. 相似文献
2.
为解决传统关联聚类算法挖掘网络异常数据时间复杂度高、精确度不理想等问题,提出Spark-MML聚类算法。为Apriori关联规则算法设计并行化频繁项集挖掘环境,使用兴趣度约束与支持度自适应策略挖掘网络数据特征量强关联规则;利用可变网格的局部离群点检测算法剔除K-means聚类离群点,基于最大最小距离确定聚类中心及数值K,将网络数据分为异常和非异常。测试结果表明,该方法避免聚类中心选取陷入局部最优,降低了异常数据挖掘的时间复杂度,有效节约算法运行空间,是一种可靠的网络异常数据挖掘方法。 相似文献
3.
4.
基于模糊关联规则的交通事故分析应用研究 总被引:3,自引:0,他引:3
研究发现交通事故潜在规律,预测交通事故的发生,针对关联规则方法用于交通事故分析,对交通的数值型属性无法给出有效地划分,为提高安全管理决策,提出引入模糊聚类,用改进FCM( Fuzzy c-Means)方法对数值属性进行聚类,可用取值的范围对分类属性进行聚类,采用模糊关联规则挖掘导致交通事故的原因和规律.模糊关联规则首先对FCM算法进行了改进,包括隶属度、权值和中心点的计算和修正方法,利用模糊关联规则方法进行挖掘,最后对算法进行了仿真和可视化显示,结果表明模糊关联规则方法挖掘出的规则符合现实情况,为交通管理提供有效的方法. 相似文献
5.
以超市的量化属性为研究对象,提出一种基于模糊聚类和减类聚类的量化关联规则算法.该算法基本思想是把模糊聚类技术融入到离散化过程中,使数据离散到合理的区间,再利用经典的布尔关联规则挖掘算法Apriori进行挖掘.实验证明,这种方法能够有效挖掘量化关联规则,提高交叉销售的可能性. 相似文献
6.
徐帆 《计算机工程与应用》2005,41(2):184-186
关系数据库中数量属性的关联规则挖掘问题是关联规则挖掘中经常要遇到的问题。该文利用遗传算法解决FCM模糊聚类问题主要是为了避免FCM算法的局部极小问题。利用聚类的结果可以使数量型属性关联规则转换成类别型属性,类别型属性再转化为布尔型属性,这样,即可以使用许多已有关联规则挖掘方法挖掘出有意义的规则。 相似文献
7.
水文时间序列关联规则挖掘模型研究 总被引:2,自引:0,他引:2
基于聚类、最小方差、统计分析、列联表检验以及兴趣度的定义,提出一种水文时间序列关联规则挖掘模型.该模型中使用了基于聚类和最小方差的离散化方法、基于统计分析的规则优化,实验结果证明通过水文时间序列关联规则挖掘模型不仅可以快速的实现水文数据的处理,而且生成的关联规则比传统的关联规则的解释能力强,规则精度高,而且可以得到数据变化规律,对水文分析和研究有指导意义,可用于预测和决策分析,提高水文数据的利用率. 相似文献
8.
模糊聚类在数量型关联规则提取中的应用 总被引:1,自引:0,他引:1
关系数据库中数量属性的关联规则挖掘问题是经常要遇到的问题。该文利用改进的FCM进行模糊聚类,主要是解决FCM算法的局部极小问题。利用聚类的结果可以使数量型属性关联规则向类别型属性转换,类别型属性再转化为布尔型属性,这样,便可以从许多关联规则的挖掘方法中找出有意义的规则。 相似文献
9.
一种自适应的模糊关联规则挖掘算法 总被引:4,自引:4,他引:0
关联规则是数据挖掘的重要研究内容之一.传统的关联规则挖掘算法仅适于处理二元属性与分类属性.为更好地处理数量属性,提出了一种自适应的基于模糊概念的量化关联规则挖掘算法.该算法克服了传统的离散分区法的不足,改进了已有模糊关联规则支持度的计算方法.引入了一种基于聚类的隶属函数自动生成方法,使得模糊关联规则的发现不依赖于人类专家给出的隶属函数,使得关联规则的表示自然、简明,有利于专家理解.实验表明该算法是有效的. 相似文献
10.
词共现文本主题聚类算法 总被引:1,自引:0,他引:1
文本主题是文本聚类的关键,而文档中共现词对对文档主题的表现力非常强.因此,在对现有文本主题挖掘和共现词对抽取算法深入研究的基础上,提出了一种基于关联规则词共现的文本主题聚类算法(TCABARWC),即首先采用关联规则挖掘算法抽取文档共现词对,利用词共现提取文本主题信息,然后根据共现词对建模并实现共现词对相似度量,最后结合层次聚类算法实现文本聚类.实验结果表明,相比其他聚类算法,基于关联规则共现词对的层次聚类算法,大大降低了文本向量的维度以及算法复杂度,在聚类效率和准确性上都有显著提高,并获得了较好的聚类效果. 相似文献
11.
基于关联规则的文本聚类算法的研究* 总被引:1,自引:0,他引:1
K-均值聚类算法是目前一种较好的文本分类算法,算法中的相似度计算通常基于词频统计,小文档或简单句子由于词频过小,使用该算法聚类效果较差。为此,提出了一种基于词语关联度的相似度计算算法,对简单文档集执行关联规则算法,得出基于关键词的关联规则,并根据这些规则求得词语关联度矩阵,然后由权重对文本进行文本特征向量表示,最后借助于关联度矩阵和文本特征向量,并按一定算法计算出句子相似度。实验证明该算法可得到较好的聚类结果,且其不仅利用词频统计的方法而且考虑了词语间的关系。 相似文献
12.
基于免疫遗传退火算法的Web关联规则挖掘方法* 总被引:1,自引:0,他引:1
摘要:根据关联规则挖掘的要求与特点,结合免疫算法,遗传算法和模拟退火算法的优点,提出一个基于免疫遗传退火算法的Web关联规则挖掘方法。实验结果表明,与遗传算法和模拟退火算法相比,基于免疫遗传退火算法的关联规则发现在Web挖掘中具有一定的优势。 相似文献
13.
论文首先对一种基于关联规则分类的算法做出了分析。然后对算法中的类关联规则的提取方法进行了改进,得到了一种新的基于关联规则分类的算法。并结合棉花病虫害数据运行的结果对两种算法的运行效率和实用性进行了比较。 相似文献
14.
基于关联规则的Apriori算法的可视化实现方法 总被引:5,自引:0,他引:5
关联规则的提取是数据挖掘中的重要研究内容,对关联规则提取中的Apriori算法进行了分析与研究,针对该算法的运算效率不高,对该算法进行了优化.该算法以经典的Apriori算法为基础,改进后的算法在运算速度明显好于Apriori算法.同时,还介绍了一种基于Apriori算法的可视化挖掘模型[1],并讨论了该可视化模型的实现方法. 相似文献
15.
一种基于约简概念格的关联规则快速求解算法 总被引:4,自引:2,他引:2
关联规则挖掘是数据挖掘领域中重要的研究分支,已形成了较多的研究成果。然而,大多数基于频繁项集求解关联规则的挖掘算法需要多次扫描数据库。该文提出了一种基于概念格的关联规则快速求解算法,该算法仅需一次扫描数据库即可确定所有的频繁项集并且进而能够快速求解出关联规则。文章首先讨论了约简概念格(RECL)的构造原理,并详细描述了基于RECL的关联规则的挖掘算法,最后以实验证明了算法的正确性和优越性。 相似文献
16.
17.
18.
19.
20.
发现频繁项集是关联规则挖掘的主要途径,也是关联规则挖掘算法研究的重点。关联规则挖掘的经典Apriori算法及其改进算法大致可以归为基于SQL和基于内存两类。为了提高挖掘效率,在仔细分析了基于内存算法存在效率瓶颈的基础上,提出了一种发现频繁项集的改进算法。该算法使用了一种快速产生和验证候选项集的方法,提高了生成项目集的速度。实验结果显示该算法能有效提高挖掘效率。 相似文献