首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 218 毫秒
1.
丁阳  钱鹏江 《计算机工程》2012,38(12):17-21
基于传统Parzen窗密度估计函数的均值漂移谱聚类算法的时间复杂度不低于O(N2),不适合医学图像分割的实际需求。为此,通过压缩集密度估计和吸引盆均匀抽样两重数据浓缩策略以降低原MSSC的高时间开销问题,从而提出新的基于数据浓缩的谱聚类算法。实验结果表明,该算法能有效降低时间开销,较好地适应医学图像分割的要求。  相似文献   

2.
乔颖  王士同  杭文龙 《控制与决策》2017,32(6):1075-1083
受Kuramoto模型启发,构造一种新的万有引力同步模型,用以解决现有同步聚类算法时间复杂度高的问题,并提出大规模数据集的引力同步聚类算法(LSCGS).首先,使用快速压缩集密度估计(RSDE)算法对大规模数据集进行压缩;然后,通过万有引力同步聚类算法对压缩数据集进行聚类,使用Davies-Bouldin指标自动寻优到最佳聚类数;最后,利用提出的剩余样本聚类(RSC)算法对除压缩集以外的剩余数据进行聚类,可以有效地区分孤立类以及噪声点.通过在大规模人造数据集、UCI真实数据集和图像数据上的实验,验证LSCGS算法的有效性,与传统同步聚类算法相比,聚类的运算成本得到大幅度的降低.  相似文献   

3.
在众多聚类算法中,谱聚类作为一种代表性的图聚类算法,由于其对复杂数据分布的适应性强、聚类效果好等优点而受到人们的广泛关注.然而,由于其高计算时间复杂度难以应用于处理大规模数据.为提高谱聚类算法在大规模数据集上的可用性,提出关键节点选择的快速图聚类算法.该算法包含三个重要步骤:第一,提出一种充分考虑抱团性和分离性的快速节点重要性评价方法;第二,选择关键节点代替原数据集构建二分图,通过奇异值分解获得数据的近似特征向量;第三,集成多次的近似特征向量,提高近似谱聚类结果的鲁棒性.该算法将时间复杂度由谱聚类原有的O(n3)降低到O(t(n+2n2)),增强了其在大规模数据集上的可用性.通过该算法与其他七个具有代表性的谱聚类算法在五个Benchmark数据集上进行的实验分析,比较结果展示了该算法相比其他算法能够更加高效地识别数据中的复杂类结构.  相似文献   

4.
针对经典k_均值聚类方法只能处理静态数据聚类的问题,本文提出一种能够处理动态数据的改进动态k-均值聚类算法,称为Dynamical K-means算法.该方法在经典k-均值方法的基础上,通过对动态变化的数据集中 新加入样本进行分析和处理,根据聚类目标函数改变的实际情况选择最相似的类别进行局部更新或进行全局经典k_均值聚类,有效检测发生聚类概念漂移和没有发生聚类概念漂移的情况,从而实现了动态数据的在线聚类,避免了经典k_均值方法在动态数据中每次都要对全部数据重新聚类而导致算法速度过慢的问题.标准数据集和人工社会网络数据集上的实验结果表明,与经典k_均值聚类方法相比,本文提出的动态k_均值聚类方法能快速高效地处理动态数据聚类问题,并有效地检测动态数据聚类过程中所产生的概念漂移问题.  相似文献   

5.
钱鹏江  王士同  邓赵红 《自动化学报》2011,37(12):1422-1434
首先证明了快速核密度估计 (Fast kernel density estimate, FKDE) 定理: 基于抽样子集的高斯核密度估计(KDE)与原数据集的KDE间的误差与抽样容量和核参数相关, 而与总样本容量无关. 接着本文揭示了基于高斯核形式的图论松弛聚类(Graph-based relaxed clustering, GRC)算法的目标表达式可分解成“Parzen窗加权和 + 平方熵”的形式, 即此时GRC可视作一个核密度估计问题, 这样基于KDE近似策略, 本文提出了大规模图论松弛聚类方法(Scaling up GRC by KDE approximation, SUGRC-KDEA). 较之先前的工作, 这一方法的优势在于为GRC作用于大规模数据集提供了更简单和易于实现的方案.  相似文献   

6.
均衡模糊C均值聚类算法   总被引:2,自引:0,他引:2  
模糊C均值聚类算法没有考虑各类样本容量因素,当各类样本容量差异较大时,其聚类判决将向小样本类倾斜。提出一种新的聚类算法——均衡模糊C均值聚类,对模糊C均值聚类算法最小化目标函数进行修正,使得改进的目标函数包含了样本容量因素,利用粒子群算法并以样本模糊隶属度为编码对象求解参数优解。从理论上分析了该算法的性质,通过仿真实验验证了所提算法对平衡、不平衡数据集的有效性。  相似文献   

7.
为解决均值漂移聚类算法聚类效果依赖于带宽参数的主观选取,以及处理密度变化大的数据集时聚类结果精确度问题,提出一种基于覆盖树的自适应均值漂移聚类算法MSCT(MeanShift based on Cover-Tree)。构建一个覆盖树数据集,在计算漂移向量过程中结合覆盖树数据集获得新的漂移向量结果KnnShift,在不同数据密度分布的数据集上都能自适应产生带宽参数,所有数据点完成漂移过程后获得聚类结果。实验结果表明,MSCT算法的聚类效果整体上优于MS、DBSCAN等算法。  相似文献   

8.
聚类集成可以有效提高传统聚类算法的精度,其关键问题在于如何根据聚类成员提供的信息获得更加优越的聚类结果.设计一种聚类集成算法,它结合K均值算法与基于拉普拉斯矩阵的谱聚类算法,充分利用聚类成员提供的属性信息与关系信息.为了降低算法计算复杂度,通过代数变换方法有效避免了大规模矩阵的特征值分解问题.在多组真实数据集上的实验结果表明,提出的算法优于其他聚类集成算法.  相似文献   

9.
谭乐怡  王守觉 《自动化学报》2013,39(10):1653-1664
为克服基于路径相似度计算时间复杂度高以及基于单一过分割区域集的聚类方法 容易导致误合并的缺陷, 提出一种结合均值漂移和路径相似度的谱聚类算法. 该算法使用超像 素构建基于路径相似度的模型来实现加速. 首先, 利用均值漂移算法对图像进行两次预分割(不同参数), 将这些过分割区域视为两组超像素集合, 构建基于双重过分割区域集的加权图; 之后, 使用各超像素的色彩均值和超像素间存在的交叉像素计算初始相似度, 再利用路径相似度模型得 到基于路径的相似度; 最后, 采用Multiway Ncut算法进行聚类. 通过算法自身参数和图结构实验, 测试算法的鲁棒性和稳定性; 通过多幅彩 色图片的分割实验, 表明本文的方法在准确性和时效性方面都具有很好的性能.  相似文献   

10.
目前,谱聚类已经成为图像分割领域的研究热点,但是,常见谱聚类算法具有0(n3)的复杂度,在图像分割的应用受到限制.基于在线的多尺度竞争学习,文中提出了一种基于在线编码的多尺度谱聚类算法,并应用于图像分割.首先,算法通过在线竞争学习算法构造m(m≤n)个原型来编码原始数据.然后,利用多尺度谱聚类对原型进行分组,标注样本并得到最终的聚类结果.算法的复杂度近似为O(mn十m2),因而,较好地提高了谱聚类在图像分割上的效率.在三组数据上开展了实验:在非凸数据集上的结果表明,文中算法具有良好的多尺度性质.在合成的高斯数据集上进行了效率对比分析,说明文中算法能有效压缩样本量,提高效率.在标准的图像上的分割效率优于通常的NJW谱聚类算法和在分割质量上优于k-means算法.和基于抽样的Nystr(o)m算法相比,具有一定优势.  相似文献   

11.
基于稀疏Parzen窗密度估计的快速自适应相似度聚类方法   总被引:1,自引:1,他引:0  
相似度聚类方法(Similarity-based clustering method,SCM)因其简单易实现和具有鲁棒性而广受关注.但由于内含相似度聚类算法(Similarity clustering algorithm,SCA)的高时间复杂度和凝聚型层次聚类(Agglomerative hierarchicalclu...  相似文献   

12.

针对谱聚类存在构造相似度矩阵时对尺度参数敏感以及处理多重尺度数据集效果不理想的缺陷, 提出一种基于密度调整的改进自适应谱聚类算法. 该算法将样本点所处领域的密度引入谱聚类, 利用密度差来调整样本点之间的相似度, 使其更符合实际簇类中样本点间的内在关系, 在一定程度上解决了多尺度聚类问题; 同时, 通过样本点的近邻距离自适应得到尺度参数, 使算法对尺度参数相对不敏感. 仿真实验验证了所提出算法的有效性和优越性.

  相似文献   

13.
程昊翔  王坚 《控制与决策》2016,31(3):551-554

针对数据中存在的噪声对数据描述建模的影响, 提出一种基于快速聚类分析的支持向量数据描述算法. 该算法通过快速聚类分析算法对所要建模的数据进行预处理, 通过预处理快速剔除数据中存在的影响建模的噪声; 然后再将基于??NN算法计算获得的权重值加权在每一个数据上, 进行支持向量数据描述算法的建模. 在标准数据集上的实验分析表明, 所提出的支持向量数据描述算法较传统的支持向量数据描述算法和密度驱动支持向量数据描述算法在准确度上具有较明显的提升.

  相似文献   

14.

针对传统数据流聚类算法聚类信息损失大、不准确的缺点, 提出一种基于维度最大熵的数据流聚类算法. 采用动态数据直方图将数据维度划分为不同的维度组, 计算各维度最大熵划分维度空间簇, 将相同维度簇的数据聚集成微簇, 通过比较微簇的信息熵大小及其分布特点实现数据流的异常检测. 该方法提升了聚类速度, 克服了传统数据流聚类算法信息丢失的缺点. 实验结果表明, 所提出算法能够提高数据流异常检测的准确性和有效性.

  相似文献   

15.
鉴于计算代价高昂的谱聚类无法满足海量网络社区发现的需求,提出一种用于网络重叠社区发现的谱聚类集成算法(SCEA).首先,利用高效的近似谱聚类(KASP)算法生成个体聚类集合;然后,引入个体聚类选择机制对个体聚类进行优选,并对优选后的个体聚类建立簇相似图;最后,进行层次软聚类,得到网络节点的软划分.实验结果表明,与代表性算法(CPM,Link,COPRA,SSDE)相比较,SCEA能够挖掘出具有更高规范化互信息(NMI)的网络重叠社区结构,且具有相对较好的鲁棒性.  相似文献   

16.

针对跨空间数据相似度学习问题提出的跨空间相似度学习(CSAL) 算法表现出了良好的性能, 并已成功地应用于各类推荐系统中. 但构建一个完善的推荐系统, 其待处理的数据量常呈现大样本特征, 而CSAL 算法并不具备大样本快速处理能力. 针对此不足, 提出了跨空间相似度学习-最小包含球(CSAL-MEB) 方法和跨空间相似度学习-核向量机(CSAL-CVM) 快速方法. CSAL-CVM 方法既具有渐近线性时间复杂度和空间复杂度的优点, 同时又继承了CSAL 的良好性能. 相关实验亦验证了所提出方法的有效性.

  相似文献   

17.
基于Bucket Sort的快速属性约简算法   总被引:2,自引:0,他引:2  
利用桶排序思想设计了一个求解U/C的算法,其时间复杂度降为O(∣C∣∣U∣).由此,给出一种无需求解正域便能判断正域是否变化的方法.基于以上方法,提出一种快速属性约简算法.该算法的求解策略是在每次迭代过程中求解决策表相对核,如果在某次迭代过程中找不到这样的核属性,则任意排除一个条件属性.最后通过实验分析了该算法在最坏情况下的时间复杂性,其复杂性降为O(∣C∣2∣U/C∣).  相似文献   

18.

针对流数据的实时、有序和维数高等特点, 提出一种基于多种群协同微粒群优化的流数据聚类算法. 该算法利用变量分而治之的思想, 多个种群协同优化多个类中心, 进而求出问题完整的类中心集合. 给出一种类中心变化趋势的预估策略, 以快速追踪环境变化. 为防止多个子微粒群同时优化一个类中心, 提出一种相似子微粒群的合并策略. 最后将所提出的算法用于多个数据集, 实验结果验证了算法的有效性.

  相似文献   

19.

针对传统图模型的流形学习无法准确表达数据间多元几何结构信息的问题, 提出一种基于超图正则化的概念分解(HRCF) 算法. 该算法用一组具有相似属性的数据子集构建超边, 建立数据间高阶关系的超图模型. 通过在概念分解算法中增加超图正则项, 保持数据间多元几何流形结构, 提高了算法的鉴别性. 在Yale 库、USPS 库和TDT2 库上的实验表明, HRCF 算法明显提高了聚类的准确率和归一化互信息, 验证了算法的有效性.

  相似文献   

20.
陆亿红  夏聪 《控制与决策》2016,31(3):541-546

传统聚类算法一般针对的是确定数据, 无法解决不确定数据的聚类问题; 现有基于密度的不确定数据聚类算法存在参数敏感且计算率低的问题. 对此, 在引进新的不确定数据相异度函数、最优?? 近邻、局部密度和互包含概念的基础上, 提出解决不确定数据聚类问题的不确定数据的最优?? 近邻和局部密度聚类(OLUC) 算法. 该算法不仅能降低参数敏感性, 提高计算效率, 而且具有动态自适应优化?? 近邻, 快速发现聚类中心和除噪优化的能力. 实验结果表明, 所提出的算法对无论是否存在噪声的不确定数据集都效果良好.

  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号