首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 234 毫秒
1.
K 均值聚类算法在银行客户细分中的研究   总被引:1,自引:0,他引:1  
研究银行客户细分问题,对客户进行分类,应针对获利最大的为识别目标.为了减少主观性分析,采用 K 均值聚类算法是数据挖掘技术在银行客户细分中一种重要方法,K 均值算法存在对初始值敏感且容易陷入局部最优值的缺点,导致银户客户分类准确率低.为了提高银行客户细分的准确率,提出了一种基于改进的 K 均值聚类的银行客户细分方法.算法首先通过有效指数法动态调整初始聚类数 K,减轻了聚类结果对初始聚类数 K 的依赖,通过自适应最佳密度半径来确定聚类中心,降低聚类中心对分类结果的影响,加快聚类速度,最后通过初始聚类数 K 和聚类中心对银行客户进行细分.在 C++ 语言平台上,采用某市银业的客户分类数据对算法进行实验,结果表明,算法有效地克服了传统 K 均值算法易陷入局部最优值,提高了客户分类准确率,聚类结果更加合理,为银行决策者提高有效的参考,并带来更多的收益.  相似文献   

2.
改进的基于遗传算法的粗糙聚类方法   总被引:2,自引:0,他引:2       下载免费PDF全文
传统的聚类算法都是使用硬计算来对数据对象进行划分,然而现实中不同类之间对象通常没有明确的界限。粗糙集理论提供了一种处理边界对象不确定的方法。因此将粗糙理论与k-均值方法相结合。同时,传统的k-均值聚类方法必须事先给定聚类数k,但实际情况下k很难确定;另外虽然传统k-均值算法局部搜索能力强,但容易陷入局部最优。遗传算法能得到全局最优解,但收敛过快。鉴于此,提出了一种改进的基于遗传算法的的粗糙聚类方法。该算法能动态地生成k-均值聚类数,采用最大最小原则生成初始聚类中心,同时结合粗糙集理论的上近似和下近似处理边界对象。最后,用UCI的Iris数据集分别对算法进行实际验证。实验结果表明,该算法具有较高的正确率,综合性能更加稳定。  相似文献   

3.
研究准确细分电信客户,提高竞争力,采用随机选择初始值聚类中心和梯度下降寻优方式,易陷入局部最优,导致电信客户细分的准确率低.为了解决C值的不足来提高电信客户细分准确率,提了一种粒子群优化C均值的电信客户细分方法(PSO-FCM),PSO-FCM通过PSO来选择电信客户细分的初始聚类中心,减小客户细分结果对聚类中心依赖,然后采用C均值算法对电信客户进行细分.在VC十十语言环境下,PSO- FCM算法对电信客户消费数据进行仿真,实验结果表明,提高了电信客户细分准确率,更助于电信企业对不同客户群制定相应营销套餐,为电信企业带来更多的收益.  相似文献   

4.
研究商业银行客户分类优化问题.商业银行客户类别具有多变性,其类别由初始聚类中心来确定,而传统K均值初始聚类中心固定,不能适应客户类别具有多变性,导致商业银行客户分类结果易陷入局部最优,分类准确率极低.为了提高商业银行客户分类的准确率,提出粒子群优化K均值聚类的商业银行客户分类模型.模型将K均值的初始聚类中心作为一个粒子,商业银行客户分类准确率作为粒子群优化的目标函数,通过粒子相互协作获得最优初始聚类中心,聚类中心具有自适应性,使然后采用最优K均值聚类算法对银行客户进行分类.仿真结果表明,优化K均值算法收敛速度快,提高了客户分类准确率,分类结果更加合理,便于对商业银行为客户采取相应经营策略.  相似文献   

5.
研究数据挖掘,优化聚类循序算法,针对提高分类的效率和准确性难题,传统聚类算法不能自动聚类的问题,为提高聚类算法的收敛速度和寻优精度,提出了一种改进的自动聚类算法,从分析基因表达式编程和k均值算法的特点出发,融合了两种算法优点,实现了在未知簇划分信息的情况下对数据集自动进行聚类分析.实践中选择k-均值算法和改进算法对聚类进行了仿真检验.结果表明,将改进的自动聚类算法应用于GIS物流选址优化中,与传统聚类算法相比,改进的算法不仅具有比较快的收敛速度和聚类精度,而且使得聚类结果更有参考价值.  相似文献   

6.
为解决DBSCAN聚类算法的Eps及MinPts参数选择问题,提出一种领域无关的参数动态选择方法。首先,基于k-均值算法对数据集进行初步聚类,聚类中采用最大最小距离方法确定初始聚类中心。其次,针对k-均值聚类结果,计算统计各聚类中样本间距离的分布情况,选择使得具有最大样本对数的距离值作为对应类的Eps值,并通过Eps获得MinPts值。最后,对DBSCAN算法进行改进,使其可根据当前核心点所属k-均值聚类对应的Eps对其运行值进行自适应调整。将上述思想运用于未知协议条件下的比特流聚类分析,结果表明,在无需用户指定Eps及MinPts的条件下,即可获得满意的聚类结果,提高了算法的适用性和准确率。  相似文献   

7.
针对经典k_均值聚类方法只能处理静态数据聚类的问题,本文提出一种能够处理动态数据的改进动态k-均值聚类算法,称为Dynamical K-means算法.该方法在经典k-均值方法的基础上,通过对动态变化的数据集中 新加入样本进行分析和处理,根据聚类目标函数改变的实际情况选择最相似的类别进行局部更新或进行全局经典k_均值聚类,有效检测发生聚类概念漂移和没有发生聚类概念漂移的情况,从而实现了动态数据的在线聚类,避免了经典k_均值方法在动态数据中每次都要对全部数据重新聚类而导致算法速度过慢的问题.标准数据集和人工社会网络数据集上的实验结果表明,与经典k_均值聚类方法相比,本文提出的动态k_均值聚类方法能快速高效地处理动态数据聚类问题,并有效地检测动态数据聚类过程中所产生的概念漂移问题.  相似文献   

8.
通过分析数据库的数据模型.研究基于内容的多媒体数据库管理系统的构建方法及其功能框架,采用PL/SOL方式访问Oracle 8i数据库.为了提高管理系统的图像检索速度,提出了一种基于内容的图像检索算法,从聚类中心初值选取和分类中心的更新方面改进C-均值聚类算法,较好地解决了图像的分类问题.实验表明:使用该聚类检索算法,能对分类中心进行快速更新,有效地对图像进行聚类以及缩短检索时间,检索性能优于现有的C-均值聚类算法.  相似文献   

9.
郑芸芸  王萍  游强华 《福建电脑》2013,(12):103-104,111
由于k-均值经典算法必须在聚类前随机地选择聚类的个数k,则后所得到的聚类结果会受到初始选择的聚类个数的影响。针对这个问题,根据寻找最优初值及免受孤立点影响的思想,提出了一种改进的k-均值聚类算法。实验证明改进的k-均值聚类算法在一定程度上解决了该算法对初始值的依赖,并部分减少了算法受噪声数据影响的可能。  相似文献   

10.
苏进  张佑生 《计算机工程》2005,31(22):110-112
提出一种分层聚类算法,该算法可识别任意形状、大小的类,在某电信企业的客户分析中取得了较好的结果。算法首先从不同的角度对电信客户进行聚类或分类,然后以这些类为基础,实行自底向上的层次聚类得到最终的聚类结果。算法执行效率高,适合大规模数据的聚类问题。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号