首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
现有聚类融合算法对混合属性数据进行处理的效果不佳,主要是融合后的结果仍存在一定的分散性。为解决这个问题,提出了一种基于图论的加权聚类融合算法,通过对数据集聚类得到聚类成员后,利用所设计的融合函数对各个数据对象赋予权重,同时通过设置各个数据对间边的权重来确定数据之间的关系,得到带权最近邻图,再用图论的方法进行聚类。实验表明,该算法的聚类精度和稳定性优于其他聚类融合算法。  相似文献   

2.
铝电解过程电流效率的影响因素多且相互耦合,为提高电解槽性能,确保电流高效率运行,需确定各因素之间的最佳匹配.针对上述问题,提出一种基于支持度权重分配数据融合改进算法的方法.首先,利用减聚类改进的模糊C均值算法进行聚类;然后,结合聚类结果,针对传统支持度权重分配数据融合算法存在的问题进行改进,得到待融合的各聚类中心的权重,进而得到铝电解过程电流效率影响因素的最佳匹配.仿真结果表明,与传统的指标最优法和均值法比较,利用数据融合得到的电流效率因素最佳匹配更实用合理,且能有效地指导电解槽操作,以提高电流效率.  相似文献   

3.

针对多视角聚类任务如何更好地实现视角间的合作之挑战, 提出一种新的视角融合策略. 该策略首先为每个视角设置一个划分, 然后通过自适应学习获取一个融合权重矩阵对每个视角的划分进行自适应融合, 最终利用视角集成方法得到全局划分结果. 将上述策略应用到经典的FCM(Fuzzy ??-means) 模糊聚类框架, 提出相应的多视角模糊聚类算法. 在模拟数据集和UCI 数据集上的实验结果均显示, 所提出的算法较几种相关聚类算法在应对多视角聚类任务时具有更好的适应性和更好的聚类性能.

  相似文献   

4.
传统的聚类融合方法通过融合所有成员实现融合,无法彻底消除劣质聚类成员对融合质量的影响,而从聚类成员的选择和加权两方面进行聚类融合,即先采用两两融合技术代替融合所有聚类结果进行聚类成员选择,然后进行基于属性的聚类成员加权,在理论上具有更好优越性。通过对真实数据和模拟数据的实验发现,该算法能有效处理聚类成员的质量差异,比传统聚类融合能得到更好的聚类结果,具有较好可扩展性。  相似文献   

5.
基于投票机制的融合聚类算法   总被引:1,自引:0,他引:1  
以一趟聚类算法作为划分数据的基本算法,讨论聚类融合问题.通过重复使用一趟聚类算法划分数据,并随机选择阈值和数据输入顺序,得到不同的聚类结果,将这些聚类结果映射为模式间的关联矩阵,在关联矩阵上使用投票机制获得最终的数据划分.在真实数据集和人造数据集上检验了提出的聚类融合算法,并与相关聚类算法进行了对比,实验结果表明,文中提出的算法是有效可行的.  相似文献   

6.
针对无监督聚类缺少数据分类等先验信息、基聚类的准确性受聚类算法影响以及一般聚类融合算法空间复杂度高的问题,提出一种基于改进遗传算法的聚类融合算法(CEIGA);同时针对传统聚类融合算法已经不能满足大规模数据处理对于时间的要求的问题,提出一种云计算下使用Hadoop平台的基于改进遗传算法的并行聚类融合算法(PCEIGA)。首先,基聚类生成机制产生的基聚类划分在完成簇标签转化后进行基因编码作为遗传算法的初始种群。其次,通过改进遗传算法的选择算子,保证基聚类的多样性;再根据改进的选择算子对染色体进行交叉和变异操作并使用精英策略得到下一代种群,保证基聚类的准确性。如此循环,使聚类融合最终结果达到全局最优,提高算法准确度。通过设计两个MapReduce过程并加入Combine过程减少节点通信,提高算法运行效率。最后,在UCI数据集上比较了CEIGA、PCEIGA和四个先进的聚类融合算法。实验结果表明,与先进的聚类融合算法相比,CEIGA性能最好;而PCEIGA能在不影响聚类结果准确度的前提下明显降低算法运行时间,提高算法效率。  相似文献   

7.
为提高聚类算法在对精度要求不高的大型数据集上的运行效率,通过比较各类聚类算法。提出了部分优先聚类算法,给出了部分优先聚类算法的相对优势和性能比较表;分析聚类成员产生方式和聚类融合方式来设计共识函数,在部分优先聚类算法的基础上,通过使用加权的方式来确定类中心后进行聚类融合,提高算法的精确度。实验结果表明了融合后的算法无论在扩展性、稳定性以及鲁棒性等方面都有着明显优势。  相似文献   

8.
一种基于投票策略的聚类融合算法   总被引:1,自引:0,他引:1  
在分类算法和回归模型中,融合方法正得到越来越广泛的应用,但在非监督机器学习领域,由于缺乏数据集的先验知识,则不能直接用于聚类算法.提出并实现了一种基于投票策略的聚类融合算法,该算法利用k-means算法每次随机选取聚类中心而得到不同样本划分的特性,将多次运行得到的聚类结果通过投票的方式合并,从而得到最终的结果.通过一系列真实数据和合成数据集的实验证明,这种方法比单一的聚类算法能更有效地提高聚类的准确率.在此基础上,为了降低高维数据运算的复杂性,将随机划分属性子空间的方法应用到上述聚类融合算法中,实验证明,该方法同时也能够在一个属性子空间上获得好的聚类结果.  相似文献   

9.
在基于视角加权的多视角聚类中,每个视角的权重取值对聚类结果的精度都有着重要的影响。针对此问题,提出熵加权多视角核K-means(EWKKM) 算法,通过给每个视角分配一个合理的权值来降低噪声视角或无关视角对多视角聚类的影响,进而提高聚类的精度。EWKKM算法中,首先用核矩阵表示不同的视角,给每个视角分配一个权重;然后,利用信息熵计算出各个视角的熵权重;最后,按照定义的目标函数对各个视角的权重进行优化,使用核K-means进行多视角聚类。在UCI数据集及人工数据集进行实验,实验结果表明熵加权多视角核K-means算法能够为每个视角分配一个最优的权重值,聚类的精确度优于已有的聚类算法,具有更稳定的聚类结果。  相似文献   

10.
基于聚类融合的多目标跟踪算法   总被引:3,自引:0,他引:3  
多目标跟踪是多传感器数据融合中的一个重要问题。基于模式识别理论 ,提出了一种通过对传感器测量数据集类 ,以区分源于不同目标的测量数据集合。对各个类对应的目标状态估计进行融合 ,从而实现了对多目标的实时跟踪。这种算法聚数据关联、数据融合和目标跟踪于一体 ,大大降低了多目标跟踪问题的复杂性和计算量。实际数据实验充分表明了本算法的有效性。  相似文献   

11.
对赋权图上经典优化问题的DNA计算方法进行探讨,改进原有DNA计算模型中的权值编码方法,提出一些新的DNA编码方法及DNA算法.具体地说,通过设计赋权无向图的相对长度图给出了旅行商问题的一种相对长度DNA编码方法及DNA算法,通过设计赋权无向图的广义边图给出了中国邮递员问题的一种广义边图DNA编码方法及DNA算法,通过选取DNA序列的最佳逆补比对给出了最小生成树问题的一种基于逆补比对的DNA编码方法及DNA算法,通过设计从顶点覆盖问题到Hamilton回路问题的一种改进多项式变换给出了顶点覆盖问题的一种基于多项式变换的DNA编码方法及DNA算法.所设计的DNA计算方法提高了DNA计算中表示数值和处理数值的能力.  相似文献   

12.
为了在聚类假设的基础上,进一步提高支持向量机的分类精度,文中通过引入线性分段转换函数,将加权无向图上的相似矩阵重新表示,改变该图上的距离度量,使得在同一群集中两点间的距离更小,从而建立基于图的聚类核,与多项式核函数线性组合后,构造出基于图的组合半监督聚类核,并将其用于支持向量机的训练和分类。实验表明,与标准SVM算法相比,该算法分类精度较高,且高于组合前的单个核函数。随着标记样本比例的增加,该算法的分类精度也在增加,有效利用了未标记样本蕴含的信息。  相似文献   

13.
Energy games belong to a class of turn-based two-player infinite-duration games played on a weighted directed graph. It is one of the rare and intriguing combinatorial problems that lie in NPco-NP, but are not known to be in P. The existence of polynomial-time algorithms has been a major open problem for decades and apart from pseudopolynomial algorithms there is no algorithm that solves any non-trivial subclass in polynomial time. In this paper, we give several results based on the weight structures of the graph. First, we identify a notion of penalty and present a polynomial-time algorithm when the penalty is large. Our algorithm is the first polynomial-time algorithm on a large class of weighted graphs. It includes several worst-case instances on which previous algorithms, such as value iteration and random facet algorithms, require at least sub-exponential time. Our main technique is developing the first non-trivial approximation algorithm and showing how to convert it to an exact algorithm. Moreover, we show that in a practical case in verification where weights are clustered around a constant number of values, the energy game problem can be solved in polynomial time. We also show that the problem is still as hard as in general when the clique-width is bounded or the graph is strongly ergodic, suggesting that restricting the graph structure does not necessarily help.  相似文献   

14.
杜航原  张晶  王文剑   《智能系统学报》2020,15(6):1113-1120
针对聚类集成中一致性函数设计问题,本文提出一种深度自监督聚类集成算法。该算法首先根据基聚类划分结果采用加权连通三元组算法计算样本之间的相似度矩阵,基于相似度矩阵表达邻接关系,将基聚类由特征空间中的数据表示变换至图数据表示;在此基础上,基聚类的一致性集成问题被转化为对基聚类图数据表示的图聚类问题。为此,本文利用图神经网络构造自监督聚类集成模型,一方面采用图自动编码器学习图的低维嵌入,依据低维嵌入似然分布估计聚类集成的目标分布;另一方面利用聚类集成目标对低维嵌入过程进行指导,确保模型获得的图低维嵌入与聚类集成结果是一致最优的。在大量数据集上进行了仿真实验,结果表明本文算法相比HGPA、CSPA和MCLA等算法可以进一步提高聚类集成结果的准确性。  相似文献   

15.
广义系统信息融合稳态与自校正满阶Kalman滤波器   总被引:2,自引:1,他引:1  
基于线性最小方差标量加权融合算法和射影理论,对带多个传感器和带相关噪声的广义系统,提出了分布式标量加权融合稳态满阶Kalman滤波器.推得了任两个传感器子系统之间的稳态满阶滤波误差互协方差阵,其解可任选初值离线迭代计算.所提出的稳态融合滤波器避免了每时刻计算协方差阵和融合权重,减小了在线计算负担.当系统含有未知模型参数时,基于递推增广最小二乘算法和标量加权融合算法,提出了一种两段融合自校正状态滤波器.其中第1段融合获得未知参数的融合估计;第2段融合获得分布式自校正融合状态滤波器.与局部估计和加权平均融合估计相比,所提出的标量加权融合参数估计和自校正状态估计都具有更高的精度.仿真研究验证了其有效性.  相似文献   

16.
Graph carries out a key role in graph-based semi-supervised label propagation, as it clarifies the structure of the data manifold. The performance of label propagation methods depends on the adopted graph and can be enhanced by merging different graphs that are obtained from multiple sources of information. While there exist algorithms that perform graph fusion they have several weaknesses. Most of these algorithms define graph fusion and label propagation as two separate tasks. Moreover, when the number of data expands, these strategies are not well-suited due to the use of transductive learning in the label propagation phase which makes the label prediction for unseen samples difficult. Furthermore, very few algorithms extract the information contained in the label space. Additionally, most of the graph fusion techniques adopt equal or static weights for different views, which is not the best choice as distinctive features (hence different graphs) contain various information. To overcome these shortcomings, we propose an Auto-weighted Multi-view Semi-Supervised Learning method (AMSSL), which is based on an inductive learning algorithm (i.e., Flexible Manifold Embedding) and profited a projection matrix for predicting the labels of out-of-sample data. The proposed AMSSL method represents a unified framework that dynamically fuses various information obtained from different features and also from the label space and adaptively designates appropriate weights according to the usefulness of each view. Our experimental results on seven small and large image datasets demonstrate the superiority of the proposed method compared to the use of one single feature and other state-of-the-art graph fusion methods.  相似文献   

17.
针对加注系统多传感器测量数据融合,为满足融合的可靠性与准确性需求,提出了一种改进的自适应加权融合算法。加权融合算法的关键是如何准确判定测量数据权重值,在总结分析当前权重值判定方法优缺点的基础上,将证据理论中的修正证据距离引入测量数据间距离计算,生成融合权重值,完成传感器数据融合。通过一般算例与加注系统典型算例,对所提融合算法进行验证,结果表明算法融合效果较好、鲁棒性强,具有一定的理论意义和较好的工程实用价值。  相似文献   

18.
一种实用的火电厂飞灰含碳量软测量建模方法   总被引:1,自引:0,他引:1  
提出了同时利用自适应加权融合和最小二乘支持向量机建模的实用新方法。首先,给出了基于小波的自适应加权融合和最小二乘支持向量机算法;其次,将BP神经网络、最小二乘支持向量机和基于小波的自适应加权融合的最小二乘支持向量机算法进行建模精度比较;最后,采用真实火电厂飞灰含碳量数据进行模型验证与预测,仿真结果表明基于小波的自适应加权融合的最小二乘支持向量机算法具有较好的建模精度和实用性。  相似文献   

19.
Graph-Based方法是基于图论的彩色图像分割算法中比较新颖的一种方法,且分割速度非常快。针对该算法对边缘和纹理处理效果不佳,且分割效果易受阈值影响的局限,改变了其颜色空间,结合拉普拉斯算子将带权图的边分为边缘边和非边缘边,优先处理非边缘边;再引入均匀性测度求取分割效果最佳的阈值。实验结果表明,相对于Graph-Based方法,改进的算法分割效果具有较好的准确性和适应性,更接近于人眼的感觉。  相似文献   

20.
The development of technology generates huge amounts of non-textual information, such as images. An efficient image annotation and retrieval system is highly desired. Clustering algorithms make it possible to represent visual features of images with finite symbols. Based on this, many statistical models, which analyze correspondence between visual features and words and discover hidden semantics, have been published. These models improve the annotation and retrieval of large image databases. However, image data usually have a large number of dimensions. Traditional clustering algorithms assign equal weights to these dimensions, and become confounded in the process of dealing with these dimensions. In this paper, we propose weighted feature selection algorithm as a solution to this problem. For a given cluster, we determine relevant features based on histogram analysis and assign greater weight to relevant features as compared to less relevant features. We have implemented various different models to link visual tokens with keywords based on the clustering results of K-means algorithm with weighted feature selection and without feature selection, and evaluated performance using precision, recall and correspondence accuracy using benchmark dataset. The results show that weighted feature selection is better than traditional ones for automatic image annotation and retrieval.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号