首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 495 毫秒
1.
传统K-means聚类算法的性能依赖于初始聚类中心的选择。本文将复杂网络节点的属性值作为节点的度、聚集度与聚集系数的加权值,通过计算所有节点的加权综合聚集特征值,选取综合聚集特征值高,并且彼此之间无高聚集性特征的个节点作为聚类的初始聚类中心,然后进行聚类迭代过程。实验结果表明,新算法对初始聚类中心的选取更迅速有效,避免了传统K-means算法初始聚类节点选取的敏感性,进而提高K-means算法的聚类质量。  相似文献   

2.
挖掘区间值关系数据库的模糊关联规则   总被引:3,自引:0,他引:3  
应用关系数据的模糊C-均值算法把数量型属性划分成若干个模糊集,提出挖掘区间值关系数据库数量型属性模糊关联规则的算法,在关系数据的模糊C-均值算法与部分聚集算法的基础上提出一种新的模糊聚类算法-关系数据的竞争聚集算法,并用它来划分数量型属性,由于关系数据的竞争聚集算法能得到优化的固定的聚类个数,因此能挖掘出优化的模糊关联规则。  相似文献   

3.
数据挖掘技术中聚类算法的改进研究   总被引:1,自引:0,他引:1  
针对K-means算法所存在的问题进行了深入的研究,提出了基于密度和聚类对象方向的改进算法(KADD算法).该算法采取聚类对象分布密度方法来确定初始聚类中心,然后根据对象的聚类方向来发现任意形状的簇.理论分析与实验结果表明,改进算法在不改变时间、空间复杂度的情况下能取得更好的聚类结果.  相似文献   

4.
一种混合聚类算法及其应用   总被引:1,自引:0,他引:1  
通过分析基于网格与基于密度的聚类算法特征,提出了一种基于网格和密度的混合聚类算法,通过分阶段聚类并选取代表单元中的种子对象来扩展类, 从而减少区域查询次数,实现快速聚类。该算法保持了基于密度的聚类算法可以发现任意形状的聚类和对噪声数据不敏感的优点,同时保持了基于网格的聚类算法的高效性,适合对大规模数据的挖掘。实验数据分析验证了算法的有效性,对数据挖掘应用于设备状态监测和故障诊断具有指导意义。  相似文献   

5.
针对电力系统二次设备工作中,人工校核继电保护压板位置、描述和状态,工作量大、易出错、效率低等问题,提出了基于图像识别技术和模型聚类匹配算法的继电保护压板自动识别与校核方法.该方法首先运用图像识别技术获得压板设备、文字标签的特征信息,然后采用图像模型聚类匹配算法重新排列压板顺序得到其具体位置信息,再进行压板设备与文字关联...  相似文献   

6.
针对现有聚类集成谱算法聚类结果不稳定的问题,引入近邻传播聚类思想,设计了基于近邻传播的聚类集成谱算法(APCESA).该算法先由聚类集成和谱分得到空间结构相对简单的文本低维嵌入,然后通过近邻传播算法得到最终的聚类结果.在谱分解过程中,采用矩阵变换方法,避免了谱算法中特征值分解的高昂计算代价.对真实文本数据集的实验结果表明,所提算法比对比算法聚类更稳定,且聚类结果的NMI值和ANMI值均高于对比算法.  相似文献   

7.
K-均值聚类算法在关系数据库中的应用   总被引:2,自引:0,他引:2  
为实现K-均值聚类算法在关系数据库中的应用,对K-均值通用算法进行了改进,通过介绍把K-均值聚类算法和关系数据库管理系统(RDBMS)相结合的一种思想,目标是允许K-均值方法对关系DBMS内部的大数据集进行聚集.分析证明,改进后的K-均值聚类算法能够获得更好的聚类结果.  相似文献   

8.
基于特征关联度的K-means初始聚类中心优化算法   总被引:3,自引:0,他引:3  
针对K-means算法在进行文本聚类时对初始聚类中心敏感的问题,提出基于特征关联度的初始聚类中心选择算法.由于在原始文本集中不易找到类别代表性都较强的多个独立文本作为初始聚类中心,因此先从降维后的文本特征集合中,选取关联度大的特征构造新的文本集,再利用“或运算”合并其中的相似文本得到初始聚类中心候选集,最后通过计算文本密度并结合“最小最大”原则从候选集中选取最优的初始中心.在5个数据集上进行对比实验,该算法在多数聚类结果中的F-score值都高于90%,熵值低于0.5,明显优于Mahout提供的K-means算法,表明该算法可选出高质量的初始聚类中心,得到更好的聚类结果.  相似文献   

9.
为了更好地调度共享单车,提出了一种新的、基于变色龙算法的共享单车站点聚类算法,算法先按照k-近邻思想将站点关联图简化为k-近邻图,并以边割最小原则将图划分成大量子簇;然后,算法按照子簇的相似度不断合并子簇,直到构成指定的聚类数目。详细的实证分析表明:基于变色龙算法的站点聚类分析可以按照不同的聚类数目将站点聚类成不同粒度的聚类,凭借这些聚类可以找出城市中共享单车流动相对封闭的区域(城市小世界特征)。  相似文献   

10.
针对k-prototypes聚类算法随机选取初始聚类中心导致聚类结果不稳定,以及现有的大多数混合属性数据聚类算法聚类质量不高等问题,提出了基于平均差异度的改进k-prototypes聚类算法.通过利用平均差异度选取初始聚类中心,避免了初始聚类中心点选取的随机性,同时利用信息熵确定数值数据的属性权重,并对分类属性度量公式进行改进,给出了一种混合属性数据度量公式.结果表明,改进后的算法具有较高的准确率,能够有效处理混合属性数据.  相似文献   

11.
针对已有的灰色关联度模型仅适用于实数序列而不能应用于区间灰数序列的情况,通过引入决策者心态指标,将区间灰数序列转化为决策者心态指标序列,并且当决策者的心态指标确定时,心态指标序列就转化为实数序列,于是通过对体现决策者心态的实数序列建立灰色关联度模型,得到了反映出决策者心态的灰色关联度,从而构建了基于心态指标的区间灰数关联度模型。决策者处于不同心态时,可以通过调整其心态计算灰关联度,从而使建立的关联度模型更加符合实际。最后,通过计算实例说明了模型的可行性。  相似文献   

12.
文中提出了一种与矢量量化相结合的条件刷新序列图像编码方法.并对基本的条件刷新法的像素块的划分,量化门限的选取和非零像素块的地址编码做了研究.可以看出,矢量量化技术和条件刷新相结合的方案进一步提高了编码效率,利用查表法来实现矢量量化,提高了编码速度.文中同时也给出了方案的计算机模拟结果.  相似文献   

13.
为了解决在遗传算法聚类分析中影响算法效率的互相关性问题以及在没有先验知识的情况下确定类别数问题,在充分分析基因的互相关性对算法效率和收敛性影响的基础上,借鉴多染色体生物的进化特性,提出多染色体取代传统单染色体的遗传算法.算法在进化过程中充分利用类簇之间的相互关系,提高了遗传算法的效率和收敛能力,并且在遗传过程中类别数量可变;为了明确地控制类别数,采用基于分布拟合的适应度函数,为在没有先验知识的情况下确定类别数提供了分析依据.通过与K均值的遗传算法(KGA)、最大期望算法(EM算法)的对比分析以及针对遥感影像的实验表明,该遗传算法在对类别数能进行自适应控制的基础上,在效率和收敛性上也都能取得较好的效果.  相似文献   

14.
通过对各种聚类算法的研究比较,提出基于模糊关联聚类分析的CMYK色彩空间数据采样方法,该方法可以充分利用隶属向量中各分量所提供的信息,分类结果更合理,同时,将RGB颜色空间样本数据转换到CIELab均匀颜色空间中,用灰色关联度作色彩相似性的测试,可以更好地指导彩色样本数据的分类。  相似文献   

15.
构建了河南省产业集聚水平测度和区域经济竞争力评价指标体系,在采用主成分分析综合评价的基础上,运用灰色关联分析和回归分析法对二者的互动关系进行实证检验。从结果发现,河南省产业集聚水平与区域经济竞争力相互影响、相互作用,变化趋势高度一致,存在密切的互动关系,产业集聚水平对河南省区域经济竞争力具有明显的促进作用,河南省产业集聚水平每提高1个百分点将促进河南区域经济竞争力提高1.388 9个百分点。  相似文献   

16.
为了缓解超密集网络中毫微微小区基站(FBS)间的同层干扰,提出一种基于干扰受限的分簇及资源分配(ILCRA)方案,该方案用一个预先设置的干扰门限来限制每个FBS簇内成员的数量。首先采用聚合成簇的思想对FBS进行分簇,每个FBS簇中干扰权值之和不能超过干扰门限,然后在每个FBS簇内采用穷举图着色算法依次对用户设备(UE)进行分簇;其次,在每个FBS簇内独立地分配资源,根据UE簇在每个子信道上的吞吐量依次为每个UE簇分配子信道;最后在每个FBS簇内采用注水算法为簇内用户分配功率。仿真结果显示,该方案有效地限制了FBS簇内成员的数量,提升了系统的吞吐量和频谱效率。  相似文献   

17.
An application of an unequal-weighted multi-objective decision making method in site selection of a waste sanitary landfill is discussed. The eight factors, which affected possible options, were: size and capacity of the landfill, permeability of the stratum, the average difference in elevation between the groundwater level and the bottom of the landfill pit, quality and source of clay, the quality grade of the landfill site, the effect of landfill engineering on nearby residents, distance to the water supply and the water source as well as the cost of construction and waste transport. These are determined, given the conditions of the geological environment, the need for environmental protection and landfill site construction and transportation related to the design and operation of a sanitary landfill. The weights of the eight factors were further investigated based on the difference in their relevance. Combined with practical experience from Xuzhou city (Jiangsu province, China), the objectives, effects and weights of grey decision-making were determined and the process and outcome of the landfill site selection are stated in detail. The decision-making results have been proven to be acceptable and correct. As we show, unequal-weighted multi-objective grey situation decision-making is characterized by easy calculations and good maneuverability when used in landfill site selection. The number of factors (objectives) affecting the outcome and the quantitative method of qualitative indices can be adjusted on the basis of concrete conditions in landfill site selection. Therefore, unequal-weighted multi-objective grey situation decision making is a feasible method in selecting landfill sites which offers a reference method for landfill site selection elsewhere. It is a useful, rational and scientific exploration in the choice of a landfill site.  相似文献   

18.
电信业务每天都产生大量数据,如何从这些数据中提取有用的信息是当今数据挖掘的难题之一。针对实际应用中存在聚类簇数难以确定、单趟聚类算法有时不能收敛到用户指定的簇数等问题,提出了可调多趟聚类挖掘方法。第1趟通过引入一个较大的K值,采用K-means聚类算法,获得K个簇,为第2趟聚类的簇数及簇中心初始值选择提供参考。经电信现网业务数据实验,本文的方法既改善了原聚类方法的局部收敛性,又能较好地适应用户的不同数据分析需求,该方法可用于不确定簇数的大数据分析中。  相似文献   

19.
Aimed at the Boolean clauses clustering, a two phases clustering method for CNF clauses is proposed. At the beginning, each clause is treated as a cluster. In the first phase, by a link based clustering method, the common neighbors between two clusters is used to determine how to merge the clusters. In the second phase, a similarity based clustering method is used. The first phase uses a global view to cluster the clauses, so the global optimum can be achieved in some sense. The second phase uses similarity to merge clusters, so the setting of the number of the final clusters in the algorithm is unnecessary. Experimental results show that the proposed method can lead to better clustering results with fewer common variables.  相似文献   

20.
针对传统灰色预测模型仅适用于实数序列而无法进行区间灰数序列建模的缺陷,引入决策者心态指标,把区间灰数序列转化为带有心态指标的序列,并且当心态指标确定时,带有心态指标的序列就转化为体现决策者心态的实数序列,然后通过对体现决策者心态的实数序列建立灰色预测模型,从而得到了一种基于心态指标的区间灰数预测模型。由于决策者可以通过调整其心态指标建立灰色预测模型,因而使得模型预测更加符合实际。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号