首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 328 毫秒
1.
在分析归纳原有聚类方法不足的基础上,结合粗糙理论和模糊理论,给出了改进的粗糙模糊K-均值聚类算法;设计了新的模糊粗糙K-均值聚类算法,并验证了该聚类算法的有效性;进而将这两种聚类算法应用到支持向量机中,对训练样本做预处理,以减少样本数目,提高了其训练速度和分类精度。  相似文献   

2.
传统的K-均值算法聚类虽然速度快,在文本聚类中易于实现,但其同量地依赖于所有变量,聚类效果往往不尽如人意.为了克服这一缺点,提出一种改进的K-均值文本聚类算法,它在K-均值聚类过程中,向每一个聚类簇中的关键词自动计算添加一个权重,重要的关键词赋予较大的权重.经过实验测试,获得了一种基于子空间变量自动加权的适合文本数据聚类分析的改进算法,它不仅可以在大规模、高维和稀疏的文本数据上有效地进行聚类,还能够生成质量较高的聚类结果.实验结果表明基于子空间变量自动加权的K-均值文本聚类算法是有效的大规模文本数据聚类算法.  相似文献   

3.
粗糙集理论是一种处理边界对象不确定的有效方法。将粗糙集与K均值结合的粗糙K均值聚类算法,具有简单高效且可处理聚类边界元素的特点,但同时存在缺陷。针对粗糙K均值聚类算法对初始点敏感,经验权重设置忽略数据差异性,阈值设置不合理导致聚类结果波动性大的缺陷,本文提出结合蚁群算法的改进粗糙K均值聚类算法,改进的算法中使用蚁群算法中随机概率选择策略和信息素更新的正负反馈机制,以及采用动态调整算法阈值和相关权重的方法,对粗糙K均值聚类算法进行优化。最后采用UCI的Iris、Balance-scale和Wine数据集分别对算法进行实验。实验结果表明,改进后的粗糙K均值聚类算法得到的聚类结果准确率更高。  相似文献   

4.
传统K-均值算法对初始聚类中心敏感大,易陷入局部最优值.将遗传算法与K均值算法结合起来进行探讨并提出一种改进的基于K-均值聚类算法的遗传算法,改进后的算法是基于可变长度的聚类中心的实际数目来实现的.同时分别设计出新的交叉算子和变异算子,并且使用的聚类有效性指标DB-Index作为目标函数,该算法很好地解决了聚类中心优化问题,与之前的两种算法相比,改进后的算法改善了聚类的质量,提高了全局的收敛速度.  相似文献   

5.
应用K-均值聚类的方法区分源于不同目标的观测数据,通过类间数据融合,实现对多目标的实时跟踪。研究了观测数据K-均值聚类的基本思想、聚类处理过程及算法实现,讨论了对机动目标跟踪的Kalman滤波方程及空管系统中易于计算的各参数矩阵理论依据及相应的初值。发现通过K-均值聚类能很好区分不同目标,聚类后再进行跟踪融合更加准确。仿真结果表明,经K-均值聚类处理后的滤波跟踪航迹效果较好。  相似文献   

6.
在已有聚类算法的基础上,提出了一种新的文本聚类新方法--合作二分K-均值算法(简称CBKM).该算法以K-均值算法和二分K-均值算法为基础,通过整体聚类、合作聚类和聚类融合3个阶段,对中间聚类结果进行再次划分,产生了具有更好聚类效果的集合.实验结果表明,合作二分K-均值算法的聚类性能优于K-均值算法和二分K-均值算法.  相似文献   

7.
针对传统的K-均值算法聚类时所面临的维数灾难、初始聚类中心点难以确定的缺点,提出一种改进的K-均值算法,其核心思想是通过降维、基于密度及散布的初始中心点搜索等方法改进K-均值算法。实验结果证明改进后的算法无论在聚类精度还是在稳定性方面,都明显优于标准的K-均值算法。  相似文献   

8.
基于可变染色体长度的遗传K均值聚类算法   总被引:2,自引:2,他引:0  
针对传统K-均值聚类算法需要事先确定聚类数,以及对初始质心的选择具有敏感性,从而容易陷入局部极值点的缺点,使用了一种基于可变染色体编码长度的遗传算法对传统K-均值聚类进行改进.该算法可以在事先不确定K值的情况下,通过多次的选择、交叉.变异的遗传操作,最终得到最优的聚类数,以及最优的初始质心集.通过Reuters数据集的实验结果表明,基于该算法的聚类划分结果明显优于传统K-均值聚类算法,并且好过基于固定染色体编码长度遗传算法的K-均值聚类算法.  相似文献   

9.
基于样本空间分布密度的初始聚类中心优化K-均值算法*   总被引:2,自引:1,他引:1  
针对传统K-均值聚类算法对初始聚类中心敏感、现有初始聚类中心优化算法缺乏客观性,提出一种基于样本空间分布密度的初始聚类中心优化K-均值算法。该算法利用数据集样本的空间分布信息定义数据对象的密度,并根据整个数据集的空间信息定义了数据对象的邻域;在此基础上选择位于数据集样本密集区且相距较远的数据对象作为初始聚类中心,实现K-均值聚类。UCI机器学习数据库数据集以及随机生成的带有噪声点的人工模拟数据集的实验测试证明,本算法不仅具有很好的聚类效果,而且运行时间短,对噪声数据有很强的抗干扰性能。基于样本空间分布密度的初始聚类中心优化K-均值算法优于传统K-均值聚类算法和已有的相关K-均值初始中心优化算法。  相似文献   

10.
基于动态粗集理论,提出了一种改进的动态粗集K-均值算法。改进后的算法依据数据对象的迁移系数大小,被划分到某一类的膨胀上近似集或膨胀下近似集;在计算类的质心时采用其中数据对象集的迁移系数的平均值作为权值来衡量它对质心的贡献。在UCI机器学习数据库原始数据集及其噪音数据集上的实验结果表明,改进后的动态粗集K-均值算法提高了聚类的准确性,降低了迭代次数。  相似文献   

11.
基于Rough集的规则学习研究   总被引:9,自引:1,他引:8  
Rough Sets方法是一种处理不确定或模糊知识的重要工具,本文在对Rough Sets理论进行深入研究的基础上,提出了一种基于Rough Sets的自增量学习算法,该算法利用简化的差异矩阵和置信度,能较好地进行确定性规则和非确定性规则的学习。  相似文献   

12.
Collaborative Filtering (CF) is one of the popular methodology in recommender systems. It suffers from the data sparsity problem, recommendation inaccuracy and big-error in predictions. In this paper, the efficient advisory tool is implemented for the younger generation to choose their right career based on their knowledge. It acquires the notions of indiscernible relation from Fuzzy Rough Sets Theory (FRST) and propose a novel algorithm named as Fuzzy Rough Set Theory Based Collaborative Filtering Algorithm (FRSTBCF). To evaluate the model, data is prepared using the cross validation method. Based on that, ratings are evaluated by calculating the MAE (mean average error), MSE (means squared error) and RMSE (root means squared error) values. Further the correctness of the model is measured by finding rates like Accuracy, Specificity, Sensitivity, Precision & False Positive Rate. The proposed FRSTBCF algorithm is compared with the traditional algorithms experiment results such as Item Based Collaborative Filtering using the cosine similarity (IBCF-COS), IBCF using the pearson correlation (IBCF-COR), IBCF using the Jaccard similarity (IBCF-JAC) and Singular Value Decomposition approximation (SVD). The proposed algorithm gives better error rate and its precision value is comparatively identical with the existing system.  相似文献   

13.
本文主要研究基于粗集理论的属性约简算法。提出了一种新的启发式约简算法,即基于加权平均和频度的双向选择约简算法。本文还通过实例验证了该算法的可行性和有效性。  相似文献   

14.
张腾飞  陈龙  李云 《控制与决策》2013,28(10):1479-1484

粗糙??-means 聚类算法是一种有效的处理聚类边界模糊问题的算法, 但大多数算法对簇的下近似集和边界 中的对象使用统一的权值, 忽略了簇内对象之间的差异性. 针对这一问题提出一种新的改进算法, 通过对簇内的每个 对象加入簇内不平衡度量, 以区分不同对象对簇的贡献程度, 使得聚类结果簇内更紧凑、簇间更疏远. 不同数据集的 仿真实验结果表明, 所提出算法可以有效提高聚类结果的精度.

  相似文献   

15.
变精度粗糙集模型在决策树构造中的应用   总被引:1,自引:0,他引:1  
针对ID3算法构造决策树复杂、分类效率不高等问题,本文基于变精度粗糙集模型提出了一种新的决策树构造算法。该算法采用加权分类粗糙度作为节点选择属性的启发函数,与信息增益相比,该标准更能够全面地刻画属性分类的综合贡献能力,计算简单,并且可以消除噪声数据对选择属性和生成叶节点的影响。实验结果证明,本算法构造的决策树在规模与分类效率上均优于ID3算法。  相似文献   

16.
结合粗糙集理论中的上下近似理论与图论中的最小生成树算法提出了粗糙最小生成树算法,并构造了确定性最小生成树和可能性最小生树。  相似文献   

17.
基于分治的属性约简复杂性分析   总被引:2,自引:0,他引:2  
属性约简是粗糙集理论研究的主要内容之一,该文采用了分治策略,提出了一个新的属性约简方法,将计算整个全域上的属性约简问题转化为计算相应划分的子区域上属性约简问题。将原有计算POSX0(Y)的算法复杂度O(|A||U|2)犤4犦降为O(|A|(|Y1|2+|Y2|2+……+|Yn|2)),对于一般比较大的|U|来说,明显地提高了属性约简可计算性和计算效率。  相似文献   

18.
粗糙集对于学习分析系统的属性约减模型有着重要的研究意义和使用价值。针对教育大数据高维度、不完备、增量性等现状,提出了基于不完备决策表的差别信息增量更新算法,并结合树形结构对差别信息的高效存储和粗糙集的核属性概念,设计构建了MIX_FP树,实现高维属性的有效约减。实验结果验证了该算法具有较好的运行效率和空间性能,为教育大数据的属性约减提供了有效的方法,同时为基于粗糙集理论的属性约减算法研究和及其在学习分析领域的应用提供了新的研究思路。  相似文献   

19.
Rough集(RS)理论中如何补偿或拓展Rs约简的局部决策规则使之更加接近全局规则是一个重要的议题。本文提出RS与MAXNET网络结合拓展建立盼MAXNET全局网络分类器模型。基于上述模型进行的脱机手写模式识别算法说明了其有效性。  相似文献   

20.
数据挖掘是近年来数据库领域中出现的一个新兴研究热点,它是从大量数据中获取知识。进行数据挖掘的方法很多,粗糙集方法便是其中的主要方法之一。属性约简算法是基于粗糙集理论的数据挖掘模型中的关键步骤,同时也是粗糙集理论研究中的一个研究重点。通过对粗糙集理论的属性约简算法的深入研究,本文提出了一种改进的属性约简启发式算法。该算法建立在可辨识矩阵计算基础上。改进算法基于Hu的算法与Jelonek算法,在计算可辨识矩阵的基础上,保证最终能够找到决策信息系统的一个约简,同时较Jelonek算法相比,运算时间明显减少。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号