首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 140 毫秒
1.
该文将T-分布随机近邻嵌入(TSNE)引入到聚类集成问题中,提出一种基于TSNE的聚类集成方法。首先通过TSNE最小化超图邻接矩阵的行对应的高维数据点与低维映射点分布之间的KL散度,使得高维空间结构在低维空间得以保持,然后在低维空间运行层次聚类算法获得最终的聚类结果。在基准数据集上的实验结果表明: TSNE能够提高层次聚类算法的聚类质量,该文方法获得了优于主流聚类集成方法的结果。  相似文献   

2.
针对概念分解(Concept Factorization, CF)算法没有同时考虑样本中存在的类别信息及数据间多元几何结构信息的问题,该文提出一种基于超图正则化受限的概念分解(Hyper-graph regularized Constrained Concept Factorization, HCCF)算法。HCCF算法通过构建一个无向加权的拉普拉斯超图正则项,提取数据间的多元几何结构信息,克服了传统图模型只能表达数据间成对关系的缺陷;同时采用硬约束的方式使样本的类别信息在低维空间中保持一致,充分利用了标记样本的类别信息。该文采用乘性迭代的方法求解HCCF算法的目标函数并证明了其收敛性。在TDT2库、Reuters库和PIE库上的实验结果表明,HCCF算法提高了聚类的准确率和归一化互信息,验证了算法的有效性。  相似文献   

3.
徐森  周天  于化龙  李先锋 《电子学报》2013,41(6):1219-1224
 首先将聚类集成问题归结为直观的最佳子空间的求解问题;随后根据线性代数理论将该问题描述为带约束条件的优化问题,通过放松离散约束条件进一步约简为矩阵低秩近似问题;最后通过求解超图的加权邻接矩阵的奇异值分解问题获得最佳子空间的一组标准正交基.据此,设计了一个基于矩阵低秩近似的算法,该算法根据每个对象在低维空间下的坐标使用K均值算法进行聚类,从而得到最终的结果.在多组基准数据集上的实验结果表明:较之于传统的聚类集成算法,本文的算法获得了更好的聚类结果,且效率较高.  相似文献   

4.
基于特征加权和非负矩阵分解的多视角聚类算法   总被引:2,自引:0,他引:2       下载免费PDF全文
刘正  张国印  陈志远 《电子学报》2016,44(3):535-540
为了在多视角聚类过程中同时考虑特征权重和数据高维性问题,提出一种基于特征加权和非负矩阵分解的多视角聚类算法(Multiview Clustering Algorithm based on Feature Weighting and Non-negative Matrix Factorization,FWNMF-MC).FWNMF-MC算法根据每个视角中每个特征在聚类过程中的重要性,自动赋予不同的权值.通过将每个视角空间中的特征矩阵分解为基矩阵与系数矩阵的乘积,将多视角数据从高维空间映射到低维空间.为了有效利用每个视角信息挖掘聚簇结构,最大化每个视角在低维空间的一致性.最后实验结果表明FWNMF-MC算法的聚类效果明显优于已有的4种有代表性的多视角聚类算法.  相似文献   

5.
聚类的根本在于对数据的划分与集合,数据可通过聚类算法对象的相似性与不同合集中对象的区别性来进行数据记录.近年来,由于数据库的信息量大量增长,在面对大规模数据集时,聚类分析的算法形式已经无法满足高内存,高CPU的时间限制,传统的数据算法正面临着"不高效"的严峻问题.本文旨在根据大规模数据集的背景,进一步分析聚类算法的优缺性,并针对其问题研究聚类新算法的设计方法.  相似文献   

6.
区域健康数据的特点是其具有海量性和高维性,而使用传统K-means聚类方法无法应对高维度的数据处理,不但容易造成结果误差,且会使算法的执行效率较低、时间开销较大。针对上述问题,文中对传统K-means聚类方法进行了深入改进,在加入模糊项以保证其聚类效果的基础上,使用粗糙集理论对高维数据属性的权重值进行确定,通过对其数据属性数量进行简化,从而保证模型的精确度与执行效率。数值实验结果表明,文中所提算法在处理高维数据时,其准确度相较对比算法提升了约5%,算法的执行时间相较传统算法缩短了约50%,证明了该算法对高维数据进行聚类处理的有效性。  相似文献   

7.
一种有效的高维分类数据聚类方法研究   总被引:1,自引:0,他引:1  
随着数据规模的不断增大,提高K-modes聚类算法或模糊K-modes聚类算法的运行效率成为了一个重要问题.为了提高其算法执行效率,提出了一种基于分治法的高维分类数据聚类方法.该方法并不是一次性对所有的数据进行聚类,而是将分类数据集分成若干个子集,对每个子集同时进行聚类,最后对聚类结果进行融合以形成最终的聚类结果.实验结果表明大多数情况下较传统的方法在聚类的速度上有显著的提高.  相似文献   

8.
向志华  邵亚丽 《电子科技》2019,32(11):70-73
为解决传统聚类算法无法对高维数据聚类的问题,文中提出了一种结合贪心选择和特征加权的TC-Mean shift高维数据聚类算法。通过对一维数据进行聚类,获得一维数据的聚类结果,再通过加权添加维度聚类,最终获得所有维度数据的聚类,实现对高维数据的聚类。测试结果表明,该算法能够准确地对稀疏的高维数据样本进行聚类,能够处理各种维度的数据,具有良好的实际应用价值。  相似文献   

9.
针对日志数据的异常检测获取标记数据代价过高的问题,提出一种基于模糊核聚类与主动学习的算法,即KFCM-AL算法。首先将日志解析,之后利用模糊核聚类算法将待选样本在高维空间进行划分聚类,滤去样本冗余点,同时选取聚类中心进行标记构建初始分类器,最后结合主动学习利用较小的标记代价对异常检测模型进行优化。实验结果表明,所提方法能够利用较少的标记样本获取异常检测模型的性能提升。  相似文献   

10.
杨峰  刘胜强 《电子设计工程》2022,30(3):113-116,121
针对传统聚类算法对于大数据背景下大量电力大数据异常监测过程中存在的问题,提出在电力大数据异常值检测中的快速密度峰值聚类算法的改进.对传统基于密度峰值空间聚类方法进行分析,得到传统算法在使用过程中的问题.提出了快速密度峰值聚类算法的改进,对自适应参数与聚类中心自动的选择,通过标准化局部密度与距离对大数据异常值进行评测,能...  相似文献   

11.
Wan  Jing  Cui  Meiyu  He  Yunbin  Li  Song 《Wireless Personal Communications》2020,111(4):2191-2214

In the case of current technology, most of the measurements are focused on geometric distance, and the distribution of data is not considered. In order to compensate for this shortcoming of geometric distance measurement, this paper uses the KL distance as the similarity measurement standard for uncertain data, and the DOUD_C algorithm and COUD_C algorithm are proposed respectively in the discrete domain and continuous domain. In order to solve the problem of efficient clustering of the high dimensional data, this paper considers the data structure of grid, and BROUD_C algorithm is proposed. According to the adjacency characteristic of the grid, the cluster process is extended continuously, the algorithm can find clusters of arbitrary shapes, and we can filter a large number of isolated points, it solves the uncertain data clustering problem effectively in the obstacle space. The experimental results show that compared to the OBS_UK_means with VPA and SDA pruning algorithm and FOPTICS algorithm, the clustering performance of BROUD_C algorithm is more significant and CPU has less execution time in the obstacle space.

  相似文献   

12.
The main challenge in wireless sensor network deployment pertains to optimizing energy consumption when collecting data from sensor nodes. This paper proposes a new centralized clustering method for a data collection mechanism in wireless sensor networks, which is based on network energy maps and Quality-of-Service (QoS) requirements. The clustering problem is modeled as a hypergraph partitioning and its resolution is based on a tabu search heuristic. Our approach defines moves using largest size cliques in a feasibility cluster graph. Compared to other methods (CPLEX-based method, distributed method, simulated annealing-based method), the results show that our tabu search-based approach returns high-quality solutions in terms of cluster cost and execution time. As a result, this approach is suitable for handling network extensibility in a satisfactory manner.  相似文献   

13.
The radar signal sorting method based on traditional support vector clustering (SVC) algorithm takes a high time complexity, and the traditional validity index cannot efficiently indicate the best sorting result. Aiming at solving the problem, we study a new sorting method based on cone cluster labeling (CCL) method. The CCL method relies on the theory of approximate coverings both in feature space and data space. Also a new cluster validity index, similitude entropy (SE), is proposed. It can be used to evaluate the compactness and separation of clusters with information entropy theory. Simulations including the performance comparison between the proposed method and the conventional methods are presented. Results show that while maintaining the sorting accuracy, the proposed method can reduce the computing complexity effectively in sorting the signals.  相似文献   

14.
针对传统直觉模糊C均值聚类(Intuitionistic Fuzzy C-means,IFCM)的图像分割算法对噪声和初始聚类中心敏感,导致聚类精度不高和迭代次数多的问题,提出一种结合局部信息的直觉模糊核聚类的图像分割算法。在该算法中,首先采用基于直方图的方法确定聚类中心初始值,解决算法对聚类中心的初始值敏感的问题;其次,利用核函数将待分类数据集映射到高维非线性空间,改善分类数据的线性可分性,同时在目标函数中引入局部灰度信息和局部空间信息,优化直觉模糊隶属度的计算方法,提高直觉模糊聚类的分类精度。实验结果表明,提出算法能减少迭代次数,提高聚类精度,能有效对图像进行分割;无论在对图像分割还是在聚类有效性上,提出算法都要优于传统的模糊聚类算法,如模糊C均值聚类(Fuzzy C-means,FCM)、模糊核均值聚类(Kernel-based fuzzy c-means,KFCM))、引入空间信息的直觉模糊C均值聚类(Intuitionistic Fuzzy C-means with spatial constraints ,IFCM-S)、模糊空间聚类(Fuzzy Local Information C-means,FLICM)、直觉模糊C均值聚类(Intuitionistic Kernel-based Fuzzy C-means,IFKCM)等。   相似文献   

15.
燕京京  王鹏  范家兵  黄焱 《电子学报》2016,44(2):405-412
提出了一种基于量子谐振子模型的聚类中心选取算法.该算法以量子谐振子波函数从高能态到基态过程中的概率变化过程为理论模型来描述聚类问题中数据对象向聚类中心点的聚集行为,能够快速查找到最优的聚类个数及较好的聚类中心点所在的网格;数据读入网格结构之后,算法的处理时间与数据集规模无关.实验结果表明:CCSA-QHOM算法较适合于处理每个子类局部区域的网格密度分布呈单峰特性的数据集的聚类中心选择问题.  相似文献   

16.
一种基于距离调节的聚类算法   总被引:2,自引:1,他引:1  
针对k-means算法不适合凹形样本空间的问题,提出了一种基于距离调节的聚类算法.算法中引入了一种调节最短路径距离作为算法的相似度函数,该函数可以使经过高密度数据区域的两点距离缩短,而经过低密度数据区域的两点距离加长,由此来缩小类间样本的相似度,同时加大类间的相似度,以及更好的聚类.实验结果证明,该算法对凹状的聚类样本空间具有很好的聚类效果.  相似文献   

17.
针对传统K—Means聚类算法需要用户输入聚类数目的缺点,对K—Means聚类算法进行了改进,提出使用一个有效指数来克服这个问题,该算法不需要背景知识,自动聚类,提高了聚类的准确性。该算法还可以根据数据量的大小确定合适的步长,增强了适应性。通过将该算法应用于网站日志数据中对用户进行聚类,验证了算法的有效性。  相似文献   

18.
基于双隐变量空间局部粒子搜索的人体运动形态估计   总被引:1,自引:0,他引:1  
该文提出一种双隐变量空间局部粒子搜索(DLVSLPS)算法,可以从多视角图像序列的轮廓特征较准确地估计出3维人体运动形态序列。该算法用高斯过程动态模型(GPDM)降维建立双隐变量空间和低维隐变量数据到高维数据的映射关系后,然后对双隐变量空间使用近邻权重先验条件搜索(NWPCS),实现局部低维粒子搜索来生成较优高维数据,从而估计相应帧的3维人体运动形态,解决传统粒子滤波算法直接在高维数据空间采样较难获取有效正确数据进行估计的问题。经仿真实验验证,所提出的算法比传统粒子滤波算法在实现多视角非连续帧估计,克服轮廓图像数据歧义,减小估计误差有明显优势。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号