首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 140 毫秒
1.
基于云计算及数据挖掘技术的海量数据处理研究   总被引:1,自引:0,他引:1  
主要介绍了在HADOOP平台下使用优化的SPRINT算法进行海量数据处理。首先介绍了传统的数据挖掘算法SPRINT算法,然后结合云计算中的MapReduce编程模式对SPRINT算法进行改进和优化,将并行的sPRINT算法移植到HADOOP平台下,最后通过实验实现分布式数据处理。  相似文献   

2.
提出利用SPRINT算法对保险业务数据进行风险分析.针对医疗保险业务,详细介绍了SPRINT算法的预处理、计算最佳分裂、执行分裂的具体设计实现过程,并得出一些实用的风险规则.  相似文献   

3.
Iterative Dichotomiser version3(ID3)算法是数据挖掘中经典的决策树分类算法,其核心是分裂训练集属性的选择标准,即分裂前后的信息增益量最大,用该标准选择属性时对于取值较多的属性具有较强依赖性。剖析了ID3算法存在的不足并加以改进,引入了属性关注度,提出了改进算法AAID3算法。实验表明改进算法对原ID3算法的取值偏向问题有所克服并使分类更加准确,决策树更加简明。  相似文献   

4.
数值型关联规则挖掘是最优化问题而不是简单的离散问题,在大型数据库中挖掘数值型属性的关联规则具有一定的难度。为解决该问题,提出一种基于改进遗传算法的数据挖掘方法。针对数值型属性和布尔型属性的混合数据,设计一种分类并分界的编码方法;适应度函数采取范围收缩的策略,使属性边界向更精确的方向逼近;在此基础上设计出相应的交叉和变异算法,避免遗传算法的局部收敛和早熟问题;最后通过实例检验该算法的可行性。  相似文献   

5.
分类是一个重要的数据挖掘问题,在数据流上挖掘决策树分类器的关键技术是如何计算最佳分裂标准,现有的算法有的不能很好地处理数值型的属性,有的计算代价太高。本文首先采用数据结构CML(C lassMatrix List)收集计算最佳分裂标准仅需的信息;其次,将数值型的属性值分成适当的区间,根据它们gini index值的特殊性质,只需确定具有最大gini index梯度的区间,因而可以快速地计算最佳分裂点,实现在流数据上快速建立决策树。  相似文献   

6.
随着各类数据挖掘技术的不断创新,基于数据挖掘技术的客户关系管理日益受到旅行社重视.在强调旅行社实施CRM的应用原因后,提出CRM系统应用模型,再以数据挖掘技术的聚类分析具体算法——GACE为例,阐述了挖掘技术在CRM中的实践应用.GACE算法利用遗传算法优化K平均算法的初始值,经过SWGenerator和MSExcel两款软件的计算和衔接,解决了K平均算法的聚类分析初始划分问题.  相似文献   

7.
针对从CRM的海量信息数据中发现有价值的知识和规律的技术难题,提出将数据挖掘技术应用到CRM中,综合运用多种数据挖掘技术发掘出潜在的价值高的客户关系,预测客户的购买行为。阐述了数据挖掘技术应用到CRM中的流程和方法,并基于CART决策树算法构建了CRM数据挖掘模型,达到了CRM交互过程中的智能化要求,从而帮助企业更好的了解客户行为,提高企业核心竞争力。  相似文献   

8.
分析了云计算和数据挖掘的关系,研究了SLIQ和SPRINT两种数据挖掘算法,提供了一种数据存储量不断增加时基于动态云模型的数据挖掘算法。  相似文献   

9.
利用数据挖掘技术对当前毕业生的就业数据进行分析,发现影响就业的主要因素.其中使用C4.5算法计算了学业成绩、社团实践、获奖情况等分裂属性的增益率,以此构造决策树并对其归纳总结出一些就业规则.  相似文献   

10.
基于关联规则的数据挖掘技术在CRM中的应用研究   总被引:5,自引:0,他引:5  
阐述了数据挖掘技术在客户关系管理中的应用,说明了关联规则分析是数据挖掘技术中一项非常重要的功能,利用Apriori算法对客户挖掘信息数据库进行关联关系分析,通过分析进一步明确数据挖掘在CRM系统中的重要性。  相似文献   

11.
介绍了当前CRM的解决方案,用J2EE构建了一种基于数据挖掘的CRM系统框架,分析系统的数据挖掘部分的结构及数据挖掘EJB模型、数据挖掘算法模型和WEB层的JSP类模型等主要模型的建模,最后通过对一个超市的数据库的客户购买模式采用关联规则进行分析,验证了CRM系统的有效性.  相似文献   

12.
讨论了面向CRM的数据挖掘技术,在CRM实施过程中。运用数据挖掘能够从大量的、有噪音的数据中发现潜在的、有用的知识的特点,对CRM的庞大数据库进行分析,从中发现能够预测客户购买行为的模式。用以解决企业同客户进行交互活动时遇到的各种问题。指导企业对瞬息万变的市场做出及时的反应.笔者采用决策树算法构建了CRM数据挖掘模型。并且该模型达到了CRM交互过程中自动化和智能化的要求。  相似文献   

13.
CRM中的模糊C均值(FCM)客户聚类算法研究   总被引:4,自引:0,他引:4  
客户关系管理(CRM)中的客户聚类分析是一个新的研究领域,属于数据挖掘的应用范畴.CRM利用数据挖掘技术发现客户数据背后隐藏的、有用的、未曾预料的知识.包括利用聚类方法划分顾客类别.本文提出用模糊C均值(FuzzyC Means,FCM)聚类算法作为客户聚类的方法,得到不同客户群的聚类中心以及客户的隶属度矩阵,为客户群的特征分析提供了量化依据.并采用Matlab6.1为计算工具,最后给出了一个聚类分析实例.实验证明,本文采纳的方法可以得到满意的客户聚类结果.  相似文献   

14.
入世后保险公司面临严峻挑战,如何认识客户关系管理(CRM)对保险公司经营管理的重要性并进行CRM的应用是一个重要研究课题。保险公司应用CRM有其内在必然性和现实必然性。本文尝试将数据挖掘技术应用到CRM系统中,并提出了保险业的客户价值数据挖掘模型,为保险公司开展数据挖掘提供参考。  相似文献   

15.
为有效地管理和利用庞大的客户、销售数据,通过关联规则、分类预测、时间序列分析、聚类分析、基于Web在客户关系管理中常用到的数据挖掘技术,对客户数据库的大量客户消费信息进行分析和处理,然后将分析结果反馈给管理者和整个企业内部,为企业的客户关系管理工作提供决策支持。数据挖掘技术在客户关系管理中获得新客户,提高顾客价值,保持新客户等领域的应用。  相似文献   

16.
聚类分析是数据挖掘领域中一种非常有用的技术,它用于从大量数据中寻找隐含的数据分布模式,主要有分割法、层次法、密度法、网格法和模型法等。该文主要讨论数据挖掘中一种基于密度和网格的聚类分析算法及其在客户关系管理中的应用。该算法具有较高的聚类效率而且容易实现,可以发现任意形状的聚类,时间复杂度低,聚类精度高,适用于数据的批量更新。该文还提出增量式聚类技术,它不仅能够利用前期聚类的结果,充分提高聚类分析的效率,而且可以降低维护知识库所带来的巨大开销。实验证明了算法的有效性。  相似文献   

17.
介绍了数据仓库和客户关系管理系统的概念,分析了数据仓库应用的关键技术联机分析处理和数据挖掘之间的区别,指出基于数据挖掘的银行客户关系管理系统是银行发展的必然选择。最后给出了数据挖掘的各种模式及在银行客户关系管理系统中的应用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号