首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 62 毫秒
1.
杜星海  侯红 《微机发展》2005,15(12):132-134
为了提高软件质量,控制和改汕软件开发过程,需要有效地度量软件开发过程和分析其过程各个阶段收集的度量数据。文中将模糊聚类算法应用到软件度量的数据分析中。先给出了数据挖掘相关知识和理论,再介绍了该算法在软件度量数据分析中应用的实验研究。由于较快地发现有严重缺陷的模块,进而提高了软件测试效率。  相似文献   

2.
提出了一种基于蚁群算法的动态模糊聚类分析方法,并研究其在数据挖掘中的应用。该算法首先利用蚁群算法的较强处理局部极值的能力,克服了FCM算法对初始化的敏感,动态的确定了聚类数目和中心;然后利用蚁群聚类得到的结果,再进行FCM聚类弥补蚁群算法的不足。从而将蚁群算法与模糊C均值聚类有机的结合,实现了基于改进的目标函数聚类分析,可以寻求到具有全局分布特性的最优聚类。  相似文献   

3.
应用模糊聚类最大树算法对教学质量评估指标进行聚类以确定关键评估指标集,使用模糊相似关系挖掘出大量数据中教学质量评估指标与评估等级之间的规则,并以本校数据实例为对象建立教学质量评估模糊数据挖掘验证了该方法的有效性。  相似文献   

4.
软件度量中的数据分析技术   总被引:1,自引:0,他引:1  
从统计学的角度出发,分析比较了软件度量常用的数据分析技术以及它们的异同,对影响数据分析的因素也作了进一步说明。为软件度量实践中正确地选用数据分析技术提供指导,从而为软件开发的管理决策、项目过程监控提供了客观有效的支持。  相似文献   

5.
在模糊聚类算法中,模糊系数被用来控制簇可能重叠的程度,其负面影响是所有的数据对象会影响所有的簇。为解决该问题,Klawonn和Hppner使用模糊函数替换模糊系数(KH算法),但该方法是针对数值属性数据而设计的。然而,在许多真实的应用中,数据对象通常同时由数值属性和分类属性描述。面向混合属性数据,文中提出了一种新的基于模糊质心的模糊加权聚类算法。首先结合模糊质心和均值来表示混合属性条件下的簇中心,然后使用能够评估不同属性在聚类过程中作用的度量来评估数据对象和簇中心之间的相异度,最后给出算法框架。在3个混合属性数据集上对新算法进行了一系列的测试,实验结果表明新算法的性能优于传统算法。  相似文献   

6.
上海软件度量基准体系(SSMBSS)针对上海市、全国甚至世界范围内的软件项目或产品开发过程中的各种数据进行收集、整合和分析以得到软件行业的各种度量指标,从而更有效的为软件企业的项目管理及政府部门的决策提供支持.因此度量内容的选取和对度量数据的分析是其中关键的一个环节,论文将对该环节进行具体分析,以期得到合理的度量内容和指示器.  相似文献   

7.
从统计学的角度出发,分析比较了软件度量常用的数据分析技术以及它们的异同,对影响数据分析的因素也作了进一步说明。为软件度量实践中正确地选用数据分析技术提供指导,从而为软件开发的管理决策、项目过程监控提供了客观有效的支持。  相似文献   

8.
将模糊聚类最大树的方法应用到Web使用挖掘上,提出一种以用户浏览时间为单值和区间两种 情况的Web使用模糊聚类算法。  相似文献   

9.
基于新的相异度量的模糊K-Modes聚类算法   总被引:3,自引:2,他引:1  
白亮  曹付元  梁吉业 《计算机工程》2009,35(16):192-194
传统的模糊K-Modes聚类算法采用简单匹配方法度量对象与Mode之间的相异程度,没有充分考虑Mode对类的代表程度,容易造成信息的丢失,弱化了类内的相似性。针对上述问题,通过对象对类的隶属度反映Mode对类的代表程度,提出一种新的相异度量,并将它应用于传统的模糊K—Modes聚类算法。与传统的K—Modes和模糊K-Modes聚类算法相比,该相异度量是有效的。  相似文献   

10.
11.
针对传统面向分类属性数据的聚类算法大多是对单一指标优化而存在的局限性,将类内和类间信息同时引入到优化过程中,结合多目标优化算法与模糊中心点聚类,提出一种新颖的多目标模糊聚类算法.与传统的基于遗传算法的混合聚类方法不同的是,采用模糊隶属度对染色体进行编码,同时优化2个相对的聚类目标函数获得一组最优解集,并且采用了一种提前终止准则判断算法是否达到稳定状态并停止操作,以减少不必要的计算开销.为了进一步提高算法的效率,通过采样子集计算出相应的模糊中心点作为类的表达,然后以这些模糊中心点计算出全体样本的隶属度矩阵即可获得最终的聚类结果.对10种数据集的实验结果表明:所提方法在聚类精度和稳定性方面优于当前最新的多目标聚类算法,且计算效率也获得较大的提升.  相似文献   

12.
针对基于改进模糊聚类的数据融合算法存在融合不精确、融合可信度较低等不足,为了解决多个同质传感器在无先验知识的情况下对同一个目标的某一特征进行测量的数据融合问题,提出了一种自适应模糊[C]均值聚类的数据融合算法,主要是把自适应模糊[C]均值聚类应用到数据融合中。该算法首先在改进的模糊聚类中通过引入自适应系数以发现不同形状和大小的聚类子集,使得融合结果更精确;其次将卡尔曼滤波原理和基于多层感知机的神经网络预测法应用到误差协方差估计中,提高了融合可信度。实验结果表明,与7种经典数据融合算法进行对比,该算法在4个模拟数据集与真实数据集上融合结果较好,特别在判别函数与融合误差方面优势更为明显。  相似文献   

13.
提取区间型数据的特征值,给出适用于区间型数据模糊聚类的FCM算法族(IFCM)。该算法适用于不同特征样本数据的模糊聚类运算,并可对聚类结果进行优化。聚类效果的仿真比较表明,IFCM聚类的平均失真度比基于欧氏距离的FCM聚类算法低6.81%。由于距离定义的合理性,IFCM可以根据区间型数据的不同特点调整特征值的聚类权重,并推广至多维类型数据的模糊聚类。  相似文献   

14.
为精确分析测量系统故障数据和识别故障类型,提出一种基于模糊聚类算法的故障数据分析方法。该方法首先用小波变换有效地检测出系统故障的微弱非线性不规则信号,再用模糊聚类的方法对故障进行分类识别。由于该算法在目标函数中加入隶属度函数,同时定义明可夫斯基的距离测度,因此能够克服K-means算法不适用于进行非凸形状的聚类的缺点,从而使诊断的数据更加精确。  相似文献   

15.
为精确分析测量系统故障数据和识别故障类型.提出一种基于模糊聚类算法的故障数据分析方法。该方法首先用小波变换有效地检测出系统故障的微弱非线性不规则信号,再用模糊聚类的方法对故障进行分类识别。由于该算法在目标函数中加入隶属度函数,同时定义明可夫斯基的距离测度.因此能够克服K-means算法不适用于进行非凸形状的聚类的缺点.从而使诊断的数据更加精确。  相似文献   

16.
Clustering Incomplete Data Using Kernel-Based Fuzzy C-means Algorithm   总被引:3,自引:0,他引:3  
  相似文献   

17.
K-means和模糊C均值为代表的划分式聚类算法无法有效处理按照风格为标准划分样本的聚类任务.针对此问题,文中提出按风格划分数据的模糊聚类算法.利用风格标准化矩阵表示包含在类簇中样本的风格信息,同时使用逼近标准风格之后的样本计算距离矩阵,并以隶属度表示样本点对于类簇的可代表程度.通过常用的交替优化策略同时优化隶属度矩阵和风格标准化矩阵.文中算法可以有效利用样本的风格信息和样本点与类簇之间的关系信息,在人工数据集和真实数据集上的实验表明算法的有效性.  相似文献   

18.
数据的完整性是数据可用性的重要维度。由于数据采集等过程中存在的问题,现实中的数据往往存在缺失。现有的聚类算法在面对不完整数据时一般采用忽略缺失或填补缺失的策略,但是当数据缺失属于非随机缺失时,这样的处理策略会导致聚类精度严重下降。当数据缺失属于非随机缺失时,数据缺失模式与缺失属性的取值相关,因此在不完整对象的相似度量中加入缺失模式相似的度量,提出了两种结合缺失模式的 PCM(Possibilistic c-means)模糊聚类算法:最小化缺失模式距离之和的 PatDistPCM 算法和基于缺失模式聚类的 PatCluPCM 算法。在两个公开数据集上的实验证明, 考虑缺失模式的模糊聚类PatDistPCM和PatCluPCM算法,在对存在非随机缺失的数据进行聚类时 ,能有效提高聚类结果的准确性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号