首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 31 毫秒
1.
K均值算法是一种常用的基于原型的聚类算法。但该算法要求用户随机选择初始质心,使得K均值算法受初始化影响较大。二分K均值算法虽然改善了这个问题,但仍然要求用户指定聚类个数,影响了聚类效果。用层次聚类对二分法进行改进,解决了二分K均值算法受用户指定的聚类个数的影响的问题。并结合Chameleon算法,合并划分过细簇,优化聚类结果。仿真实验证明改进的聚类算法的抱团性和分离性优于二分K均值聚类算法。  相似文献   

2.
基于QPSO的数据聚类   总被引:1,自引:0,他引:1  
在KMeans聚类、PSO聚类、KMeans和PSO混合聚类(KPSO)的基础上,研究了基于量子行为的微粒群优化算法(QPSO)的数据聚类方法,并提出利用KMeans聚类的结果重新初始化粒子群,结合QPSO的聚类算法,即KQPSO。介绍了如何利用上述算法找到用户指定的聚类个数的聚类中心。聚类过程都是根据数据之间的Euclidean(欧几里得)距离。KMeans算法、PSO算法和QPSO算法的不同在于聚类中心向量的“进化”上。最后使用三个数据集比较了上面提到的五种聚类方法的性能,结果显示基于QPSO  相似文献   

3.
一种基于蜂群原理的划分聚类算法*   总被引:1,自引:0,他引:1  
针对现有的大部分划分聚类算法受聚类簇的个数K的限制,提出一种基于蜂群原理的划分聚类算法。该方法通过引入蜂群采蜜机制,将聚类中心视为食物源,通过寻找食物源的自组织过程来实现数据对象的聚集。在聚类的过程中引入紧密度函数来评价聚类中心(局部),引入分离度函数来确定最佳聚类簇的个数(全局)。与传统的划分聚类算法相比,本算法无须指定聚类个数即可实现聚类过程。通过仿真实验表明,本文提出的算法不但对最佳聚类数有良好的搜索能力,而且有较高的准确率:算法时间复杂度仅为O(n*k3)(k<相似文献   

4.
针对K-means算法中聚类结果易受初始聚类中心影响的缺点,提出一种改进初始聚类中心选择的算法.该算法不断寻找最大聚类,并利用距离最大的两个数据对象作为开始的聚类中心对该聚类进行分裂,如此反复,直到得到指定聚类中心个数.用KDD CUP99数据集对改进算法进行仿真实验,实验数据表明,用该算法获得的聚类中心进行聚类相对原始的K-means算法,能获得更好的聚类结果.  相似文献   

5.
针对聚类中的特征选择问题,提出一种基于特征语义权重的数据聚类方法。该方法由用户指定必需的特征集,通过计算特征之间的语义相关度,选择和指定特征集相关的特征集作为补充。利用语义相关度确定各个特征的语义权重,在特征语义权重计算的基础上对传统的K-Means聚类算法进行改进,提出具有特征语义权重的FSW-KMeans算法。实验结果表明,FSW-KMeans算法较大地提高了聚类算法准确率和效率。  相似文献   

6.
针对传统协同过滤算法中数据稀疏造成推荐准确度低以及K-means聚类算法需要预先确定聚类个数的问题,提出自适应K-means聚类算法(SKCA)。引入物理学中的拓扑势场理论,利用拓扑势值进行用户重要性表示并获得用户影响范围,结合改进K-means算法完成用户聚类并得到各类代表用户,目标用户通过与各代表用户进行用户相似度计算确定最优代表用户,在最优代表用户场域内使用协同过滤算法进行推荐。与其它算法对比的实验结果表明,SKCA在准确率、F值及运行效率上都有提升,有效缓解了数据稀疏的影响。  相似文献   

7.
吴月萍  王娜  马良 《微机发展》2011,(10):73-76
协同过滤算法是根据基本用户的观点产生对目标用户的推荐列表,现模拟蚂蚁觅食的原理,将用户视为具有不同属性的蚂蚁,聚类中心视为蚂蚁所要寻找的“食物源”,提出基于蚁群算法实现用户聚类,以提高协同过滤推荐系统的最近邻查询速度,降低搜索开销,同时避免了使用K—Means聚类方法受初始聚类中心和聚类个数的影响。最终实验验证蚁群算法实现用户聚类的有效性,且解决了新用户得不到推荐的问题,并提高了协同过滤推荐算法的精确度。  相似文献   

8.
一种Web用户行为聚类算法   总被引:13,自引:0,他引:13  
提出了一种新的路径相似度系数计算方法,并使之与雅可比相似系数结合,用于计算用户访问行为的相似度,在此基础之上又提出了一种分析web用户行为的聚类算法(FCC)。通过挖掘Web日志,找出具有相似行为的web用户,由于FCC聚类算法过滤了小于指定阚值的相似度系数,大大缩小了数据规模,很好地解决了其他聚类算法(如层次聚类)在高堆空间聚类时的“堆数灾难”问题,最后的实验结果很好。  相似文献   

9.
一种基于遗传算法的分裂式层次化聚类算法   总被引:5,自引:0,他引:5  
任江涛  吴海建  吴向军  印鉴  张毅 《计算机应用》2005,25(11):2618-2620
针对聚类中自适应确定聚类个数、目标函数灵活定义及优化的近似计算等问题,综合了分裂式层次化聚类算法能根据相似度阈值自适应地确定聚类个数的特点及二进制遗传聚类算法具有较强的搜索近似最优解能力及目标函数定义灵活的特点,提出了一种基于遗传算法的分裂式层次化聚类方法。实验结果表明,该算法具有较好的聚类性能。  相似文献   

10.
电力企业通常根据电力负荷数据,采用传统的K-Means算法对客户进行划分,而这种方法最大的缺陷就是必须由用户手动指定聚类簇数。提出了一种将Canopy算法和K-Means算法结合应用于负荷聚类的方法,无需手动指定聚类簇数。收集到的用户历史用电数据,使用并行计算框架MapReduce对原始数据进行预处理。应用Canopy和K-Means算法建立自动负荷聚类模型。在真实用电数据上进行实证分析,通过使用Silhouette指标对结果进行评估,证明提出的方法更加稳定和具有广泛的适用性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号