首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 140 毫秒
1.
聚类分析是数据挖掘中一个重要的应用领域,是一种数据划分或分组处理的重要手段和方法。聚类分析算法是Web数据挖掘中的一项关键技术,对于降低储存数据的规模,去除无用的数据信息起到突出的作用,因此它成为了一种广泛使用的数据处理方式。文章介绍了Web数据挖掘的概念、分类以及常用的实现技术,并对Web数据挖掘进行了探讨和分析,最后讨论了聚类分析算法在Web数据挖掘中的应用。  相似文献   

2.
本文重点讨论了聚类分析方法中K-means聚类算法在客户价值分析中的作用,通过对客户的现有价值和潜在价值进行分析,对客户进行细分.并针对某地区移动公司的客户数据信息,用K-means算法进行了详细的实例分析.  相似文献   

3.
数据挖掘又称为数据采集或者数据收集,它是数据库知识发现(Knowledge-Discovery in Databases)中的一个步骤.简单来说,数据挖掘指使用算法从大量的数据中搜索隐藏在其中的信息的过程.在本文中,着重介绍了数据挖掘中的聚类分析阶段.  相似文献   

4.
随着3G时代的到来,移动通信业竞争日益加剧,客户细分工作显得越来越重要.本文以CRISP-DM方法论为基础,探讨聚类分析方法在移动通信客户细分领域的应用,并重点比较了经过R型聚类提取细分变量前后聚类效果.  相似文献   

5.
数据挖掘是数据库研究、开发和应用领域最活跃的分支之一。在数据挖掘的众多技术中聚类分析已成为核心技术。本文通过对聚类分析及其算法的论述,从多个方面对这些算法性能进行比较,同时以儿童生长发育时期的数据为倒通过聚类分析的软件和改进的K-Mcans算法来进一步阐述聚类分析在数据挖掘中的实践应用。  相似文献   

6.
数据挖掘算法研究   总被引:1,自引:0,他引:1  
数据挖掘技术是一个不断发现知识的过程。阐述了目前三种流行的数据挖掘算法的理论模型及算法思想,并从算法时间复杂度、依赖条件和误差估计等方面进行了比较分析,说明了不同算法的优势和不足。指出了不同算法的应用前景,提出了一种将不同算法结合以减少误差率,提高算法效率的思路。  相似文献   

7.
为提高数据挖掘算法的挖掘速度,同时提高其精准度,提出基于电力营销聚类分析数据挖掘算法研究。首先运用聚类算法筛选数据,再计算数据结构和相异度矩阵相异度,得出最接近的类距离。完成上述步骤后,在聚类分析框架下,设计聚类分析数据挖掘算法流程。先输入数据,再设计数据挖掘算法基本策略,最后提出SLIO算法处理离散字段,得到有价值的数据信息。由此,完成基于电力营销聚类分析的数据挖掘算法设计。实验结果表明,与基于支持度-置信度-提升度的配网自动化系统数据挖掘算法和基于神经网络和粒子群优化的数据挖掘算法相比,文中基于电力营销聚类分析的数据挖掘算法的挖掘速度稳定,挖掘效果更好。同时测试精准度较高,可有效提高数据挖掘的可信度。  相似文献   

8.
随着软件系统规模的不断壮大,它的复杂性也与日俱增,一项繁琐的系统工程由软件开发工程所演变而来。在软件工程中,我们难以控制对象、活动和过程,因此数据挖掘技术的诞生为软件工程的开发提供了发展机遇。异常数据挖掘算法在许多领域中都有着重要应用,本文提出一种基于聚类的异常数据挖掘算法,该算法迅速且准确率高。实验结果表明:与传统的LOF算法比较,我们提出的新方法不仅计算时间短,而且挖掘异常数据的准确率也更高。  相似文献   

9.
本文介绍了数据挖掘的概念及相关技术,重点阐述了聚类分析和分类,然后论述了数据挖掘技术在电信行业客户保有中的应用,提出了一种基于洞察力营销的客户保有的解决方案,并对数据挖掘技术应用于客户细分、客户流失预测等进行了详细的探讨.  相似文献   

10.
基于划分的数据挖掘K-means聚类算法分析   总被引:1,自引:0,他引:1  
为提升数据挖掘中聚类分析的效果,在分析数据挖掘、聚类分析、传统K-means算法的基础上,提出一种改进的K-means算法。首先将整体数据集分为k类,然后设定一个密度参数为■,该密度参数反映数据库中数据所处区域的密度大小,■值与密度大小成正比,通过密度参数优化k个样本数据的聚类中心点选取;依据欧几里得距离公式对未选取的其他数据到各个聚类中心之间的距离进行计算,同时以此距离为判别标准,对各个数据进行种类划分,从而得到初始的聚类分布;初始聚类分布得到之后,对每一个分布簇进行再一次的中心点计算,并判断与之前所取中心点是否相同,直到其聚类收敛达到最优效果。最后通过葡萄酒数据集对改进算法进行验证分析,改进算法比传统K-means算法的聚类效果更优,能够更好地在数据挖掘当中进行聚类。  相似文献   

11.
为了给企业快速、低成本构建客户管理系统、CRM系统、数据挖掘应用系统提供参考与借鉴,研究了常用数据挖掘算法。通过研究数据挖掘算法基本原理、适用范围及优点,得出可以使用不同的算法来执行同样的业务任务,每个算法会生成不同的结果。因此在一个数据挖掘解决方案中,可以使用一些算法来研究数据,然后使用其他算法,基于这些数据预测特定结果。  相似文献   

12.
针对传统的K均值聚类分析,不考虑对象中每个变量在聚类过程中体现作用的不同,而是统一看待,用这样计算的距离来表示两个对象的相似度并不确切。文中提出了一种基于距离度量的聚类算法,算法使用新的距离度量代替了K均值聚类算法的欧式距离,应用新的距离度量之后,数据点的权重不再只为1或0,而是由系数来确定,这就将硬划分转化为软划分。最后经过实验证明了改进的聚类算法比传统的K均值聚类收敛速度有了很大提高,提高了算法的执行效率。  相似文献   

13.
李坤然  谭骏珊 《信息技术》2008,32(3):97-99,105
提出使用下降迭代算法对数值聚类分析技术进行优化.下降迭代通过设定函数,给出初始假设解,然后按照某种规则依次找到最优解.首先介绍常用聚类算法,从而引出下降迭代法聚类.通过实验证明了下降迭代算法对数值聚类优化的可行性.  相似文献   

14.
针对数据在性态和类属方面存在不确定性的特点,提出一种基于模糊C均值聚类的数据流入侵检测算法,该算法首先利用增量聚类得到网络数据的概要信息和类数,然后利用模糊C均值聚类算法对获取的数据特征进行聚类。实验结果表明该算法可以有效检测数据流入侵。  相似文献   

15.
一种改进的K平均聚类算法   总被引:2,自引:0,他引:2  
典型K平均算法中的聚类数k必须是事先给定的确定值,然而实际中很难精确确定,因而无法解决该核算法的实际问题.为此,提出距离代价函数作为最佳聚类数的有效性检验函数,建立了相应的数学模型,并据此提出了一种改进的k值优化算法.实验证明,与传统基于平均值方法实现数据聚类相比,用改进K值优化算法有效提高数据聚类效果.  相似文献   

16.
张艳肖 《信息技术》2011,(12):10-12,16
K-均值聚类对初始聚类中心的选取较敏感,容易陷入局部最优.将改进的遗传算法与K-均值聚类相结合,以优化聚类中心.在种群进化过程中,父代个体均从种群中适应度高的个体中选择,同时,根据个体适应度动态调节交叉概率和变异概率,避免早熟现象.文中采用改进的遗传算法,对学院网站服务器上的Web日志进行用户和页面聚类,达到了很好的聚类效果.  相似文献   

17.
为了解决数据挖掘中关联规则Apriori算法存在的缺陷,提出了一种全新的基于对候选项集处理的改进算法。该算法主要采用一次扫描数据库和对候选项集进行计数处理的方法,实现了减少执行时间以及计算量的目的。实际应用表明,改进后的Apriori算法具有操作简便、测试准确的特点,达到了提高数据挖掘效率和准确性的要求。  相似文献   

18.
为了提高程序开发效率、发现开发过程中的潜在规则,设计了程序算法数据库,研究了基于决策树的分类挖掘技术在程序算法数据库中的应用.  相似文献   

19.
数据挖掘就是从大量的数据中挖掘出有用的信息。数据挖掘与传统的数据分析的本质区别是数据挖掘是在没有明确假设的前提下去挖掘信息、发现知识。文章分析了数据挖掘算法的关联规则特性,对其在股票市场中的应用进行了重点,以便更好的应用在更多的领域。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号