首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 31 毫秒
1.
基于商品分类信息的关联规则聚类   总被引:11,自引:0,他引:11  
关联规则挖掘经常产生大量的规则,为了帮助用户做探索式分析,需要对规则进行有效的组织。聚类是一种有效的组织方法,已有的规则聚类方法在计算规则间距离时都需要扫描原始数据集,效率很低,而且聚类结果是固定数目的簇,不利于探索式分析.针对这些问题,提出了一种新的方法,它基于商品分类信息度量规则间的距离,避免了耗时的原始数据集扫描;然后用OPTICS聚类算法产生便于探索式分析的聚类结构。最后用某个零售业公司的实际交易数据做了实验,并通过可视化工具演示了聚类效果,实验结果表明此方法是实用有效的。  相似文献   

2.
基于模糊关联规则的交通事故分析应用研究   总被引:3,自引:0,他引:3  
研究发现交通事故潜在规律,预测交通事故的发生,针对关联规则方法用于交通事故分析,对交通的数值型属性无法给出有效地划分,为提高安全管理决策,提出引入模糊聚类,用改进FCM( Fuzzy c-Means)方法对数值属性进行聚类,可用取值的范围对分类属性进行聚类,采用模糊关联规则挖掘导致交通事故的原因和规律.模糊关联规则首先对FCM算法进行了改进,包括隶属度、权值和中心点的计算和修正方法,利用模糊关联规则方法进行挖掘,最后对算法进行了仿真和可视化显示,结果表明模糊关联规则方法挖掘出的规则符合现实情况,为交通管理提供有效的方法.  相似文献   

3.
由于进行关联规则挖掘过程中会产生大量规则,给关联规则的后期分析与利用带来了巨大障碍.针对关联规则的特点,提出了一种新的规则相似性度量方法,通过相似性度量方法推出新的规则距离度量方法,运用系统聚类中的类平均法进行聚类.实验结果表明,该距离度量方法考虑了关联规则的整体信息,依据聚类谱系图和规则散点图,确定了类和类的个数,有利于规则的分类处理.  相似文献   

4.
规则聚类将关联规则挖掘产生的大量规则重新组织,帮助用户发现感兴趣的规则。规则距离函数是规则聚类中的重要一环。本文基于分类信息的层次结构特点,对已有的规则距离函数进行改进。提出了参数控制距离和递归杈重距离的方法,解决了以往规则距离函数的多次匹配问题。通过距离函数的对比实验。证明提出的方法是合理有效的。  相似文献   

5.
关联规则的冗余删除与聚类   总被引:9,自引:0,他引:9  
关联规则挖掘常常会产生大量的规则,这使得用户分析和利用这些规则变得十分困难,尤其是数据库中属性高度相关时,问题更为突出.为了帮助用户做探索式分析,可以采用各种技术来有效地减少规则数量,如约束性关联规则挖掘、对规则进行聚类或泛化等技术.本文提出一种关联规则冗余删除算法ADRR和一种关联规则聚类算法ACAR.根据集合具有的性质,证明在挖掘到的关联规则中存在大量可以删除的冗余规则,从而提出了算法ADRR;算法ACAR采用一种新的用项目间的相关性来定义规则间距离的方法,结合DBSCAN算法的思想对关联规则进行聚类.最后将本文提出的算法加以实现,实验结果表明该算法暑有数可行的.且具较高的效率。  相似文献   

6.
为了更好地评价无监督聚类算法的聚类质量,解决因簇中心重叠而导致的聚类评价结果失效等问题,对常用聚类评价指标进行了分析,提出一个新的内部评价指标,将簇间邻近边界点的最小距离平方和与簇内样本个数的乘积作为整个样本集的分离度,平衡了簇间分离度与簇内紧致度的关系;提出一种新的密度计算方法,将样本集与各样本的平均距离比值较大的对象作为高密度点,使用最大乘积法选取相对分散且具有较高密度的数据对象作为初始聚类中心,增强了K-medoids算法初始中心点的代表性和算法的稳定性,在此基础上,结合新提出的内部评价指标设计了聚类质量评价模型,在UCI和KDD CUP 99数据集上的实验结果表明,新模型能够对无先验知识样本进行有效聚类和合理评价,能够给出最优聚类数目或最优聚类范围.  相似文献   

7.
基于模糊聚类的模糊关联规则挖掘   总被引:2,自引:0,他引:2  
通过模糊聚类,从已知数据中得到数据点对数据类的隶属度,并以此进行模糊关联规则的挖掘,从而使得模糊关联规则的发现不依赖于人类专家预先给出的隶属度函数;并且实验表明。聚类并没有带来显著的顿外计算时间,对于大型数据库,文章提出的方法是有效的。  相似文献   

8.
基于关联规则的Web文档聚类算法   总被引:32,自引:1,他引:32  
宋擒豹  沈钧毅 《软件学报》2002,13(3):417-423
Web文档聚类可以有效地压缩搜索空间,加快检索速度,提高查询精度.提出了一种Web文档的聚类算法.该算法首先采用向量空间模型VSM(vector space model)表示主题,根据主题表示文档;再以文档为事务,以主题为事务项,将文档和主题间的关系看作事务的形式,采用关联规则挖掘算法发现主题频集,相应的文档集即为初步文档类;然后依据类间距离和类内连接强度阈值合并、拆分类,最终实现文档聚类.实验结果表明,该算法是有效的,能处理文档类间固有的重叠情况,具有一定的实用价值.  相似文献   

9.
甘昕艳  唐晓年 《计算机仿真》2021,38(3):282-285,326
传统的挖掘模型未能有效提取时序数据的特征,导致计算开销较大,挖掘准确率以及效率偏低.为此,研究结合卷积神经网络设计并组建一种新的时序数据关联规则挖掘模型.通过连续模板匹配技术分析时序数据的分布式数据结构,然后结合匹配相关检测技术对时序数据展开融合处理,通过频繁项检测提取其中的关联规则特征.对提取的关联规则通过CNN分类器进行属性划分,结合特征压缩方法对分类输出的时序数据进行降维处理,再利用模糊聚类算法构建时序数据关联规则挖掘模型.仿真结果表明:模型能够有效降低挖掘过程的计算开销,并提升了挖掘结果的准确率以及挖掘效率.  相似文献   

10.
关联规则是数据挖掘中的概念,通过分析数据找到数据之间的关联.海量数据会产生大量冗余和相似的关联规则,影响用户对规则的理解和判断.本文采用鸢尾花数据集进行实验.建立三个检验指标,删除冗余关联规则;在进行K-means分析时利用规则产生的三角形迭代选择初始点,再将删除冗余后的规则进行聚类.实验证实本文方法将相似的关联规则归为一簇,能有效的帮助用户迅速找到有用的关联规则,有助于用户更好的对规则进行理解和分析,提高了聚类的效率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号