共查询到17条相似文献,搜索用时 609 毫秒
1.
2.
3.
4.
5.
本文对传统的K-means聚类算法进行了深入的分析研究,发现了算法当中的一些缺陷和漏洞,并且找出可以改进K-means聚类算法的方法,使聚类分析的结果更具有实际意义,保证了聚类结果的高质量。 相似文献
6.
7.
在大数据的数据挖掘模型中,普遍采用模糊聚类算法进行数据分析。常用的模糊C均值聚类算法即FCM聚类算法,具有较多明显缺点,如抗噪性偏低、收敛速度慢、聚类数目无法自动确定等。常用的增量式模糊聚类方法通常在原有的以一个中心点为集群代表的基础上,改为选取多中心点进行增量式聚类算法的分析。但是,通过这样的算法进行数据分析也存在一定的问题,主要表现在其中心点选择是固定的,灵活性很差。基于以上原因,文中将对原有基础算法做出改进,主要对大数据中数据挖掘模型的增量型模糊聚类算法做出分析,经实践验证,改进后算法切实可行,普适性较强。 相似文献
8.
文章研究和分析了数据流上几种典型的聚类分析算法,分析了这几种算法的优点和不足。研究了现在数据流聚类分析的现状,指出未来发展方向。 相似文献
9.
基于决策树算法的信息系统数据挖掘研究 总被引:1,自引:0,他引:1
为了提高数据挖掘准确性和效率,文中提出了基于决策树算法的信息系统数据挖掘方法.以C4.5决策树算法计算属性的信息增益率和属性值的信息熵为基础,提出基于余弦相似度改进的C4.5决策树算法,若任意两个属性值的信息熵之差在阈值范围内,通过计算其余弦相似度合并在阈值范围内的属性值,并重新计算合并后属性的信息增益率,实现信息系统... 相似文献
10.
决策树算法是数据挖掘中一种非常重要的分类方法.决策树具有属性结构和较好的分类预测能力,提供了基本的提取决策规则.本文阐述了决策树算法的基本思想,并分析了决策树算法运用中会遇到的一些问题,并针对性的提出一些建议. 相似文献
11.
12.
针对ID3算法倾向于取值较多的属性的特点,同时为避免特定领域主观属性影响分类结果,提出了一种改进的决策树算法。该方法利用决策树算法构造决策树,通过对分类结果中主客观属性进行标记并逻辑运算,最终得到较客观的决策信息,并进行实验验证。 相似文献
13.
为了开发一个中国邮政储蓄银行某分行的信贷风险管理系统,采用了数据挖掘技术。首先对数据挖掘和数据仓库技术的相关概念进行了介绍,对现有的信贷管理情况进行了分析,结合我国银行业的实际特点,得到了一个基于数据挖掘的信贷风险管理模型的设计和实现方法。在此基础上,通过在分类以前进行属性选择,不仅改善了分类器的总体性能,也降低了数据采集成本,可以提高银行信贷工作的效率。 相似文献
14.
在数据挖掘中,决策树方法是一个重点研究方向。ID3方法是著名的决策树算法,在这种算法中,互信息的计算依赖于特征值数目较多的特征,这样不太合理.为此,从离散度的角度,对ID3算法进行改进,通过2种算法的对比实验,证明利用改进后的算法挖掘分类规则,不仅提高了分类的正确率,而且非常高效。 相似文献
15.
针对电信CRM中“数据丰富但知识贫乏”现象,提出数据挖掘技术,利用SUQ决策树构造算法建立一棵决策树模型,在CRM中根据客户的年龄、所属城市和性别对客户分类,预测客户类型,防止用户流失,争取新用户具有重要意义。 相似文献
16.
针对传统的K均值聚类分析,不考虑对象中每个变量在聚类过程中体现作用的不同,而是统一看待,用这样计算的距离来表示两个对象的相似度并不确切。文中提出了一种基于距离度量的聚类算法,算法使用新的距离度量代替了K均值聚类算法的欧式距离,应用新的距离度量之后,数据点的权重不再只为1或0,而是由系数来确定,这就将硬划分转化为软划分。最后经过实验证明了改进的聚类算法比传统的K均值聚类收敛速度有了很大提高。提高了算法的执行效率。 相似文献