首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
属性图各节点附有的节点属性标签,为节点提供了更加丰富的信息,在数据挖掘应用,特别是数据聚类问题中如何有效利用这些丰富的信息,已经成为开展此类研究的研究目的.不同于传统图聚类,属性图上的聚类要同时考虑图的结构信息和节点的属性信息,因此如何平衡两者之间的关系,这是属性图聚类主要关注所在.目前已提出的属性图聚类算法,部分算法的效率很高,然而聚类质量较差,同时一些算法可以得到较好的聚类结构,然而算法消耗大量的系统资源,效率也较低.这些算法均没有考虑簇之间存在重叠的情况,这导致无法得到更高精度的聚类结构.因而提出一种属性图上的重叠聚类挖掘算法,实验表明,提出的算法可以得到更高的聚类精度,特别是可以提升聚类内部节点的属性相似度.  相似文献   

2.
图结构聚类(SCAN)是一种著名的基于密度的图聚类算法。该算法不仅能够找到图中的聚类结构,而且还能发现图中的Hub节点和离群节点。然而,随着图数据规模越来越大,传统的SCAN算法的复杂度为O(m1.5)(m为图中边的条数),因此很难处理大规模的图数据。为了解决SCAN算法的可扩展性问题,本文提出了一种新颖的基于MapReduce的海量图结构聚类算法MRSCAN。具体地,我们提出了一种计算核心节点,以及两种合并聚类的MapReduce算法。最后,在多个真实的大规模图数据集上进行实验测试,实验结果验证了算法的准确性、有效性,以及可扩展性。  相似文献   

3.
近年来,图数据聚类在学术界引起了广泛的关注,许多优秀的聚类方法,如模块度优化算法、谱聚类,以及基于密度的聚类算法在图数据上取得了很好的效果。SCAN是一种著名的基于密度的图聚类算法,该算法不仅能够找出图中的聚类,而且还能够发现不同聚类间的Hub节点,以及图中的离群点。然而,该算法存在两方面的局限性:首先,在大规模图数据上,该算法需要耗费大量的时间用于计算图中每条边的结构相似性;另一方面,该算法存在两个参数[ε]和[μ],并且对这两个参数比较敏感。为了解决其局限性,提出了一种基于OpenMP的并行算法来求解节点相似性,并且提出了两种有效的负载均衡策略;其次,提出一种基于三角形的新型图结构聚类算法TSCAN。该模型能够有效降低算法对参数的敏感性,而且还能够发现重叠以及更稠密的社区。在多个大规模数据集上实验发现,基于多核的并行算法能够达到近乎线性的加速比,而且TSCAN算法对参数不敏感,能有效发现重叠社区。  相似文献   

4.
刘琰琼  张文生  李益群  杨柳 《计算机工程》2011,37(5):207-209,212
传统聚类方法处理的是同构数据,无法满足异构数据同时聚类的应用需求,聚类结果的准确率较低,标签可读性较差。针对上述问题,提出一种基于电阻网络的异构数据协同聚类算法。该算法将异构关联数据抽象为多部图形式的电阻网络,进行特征计算及聚类。在对异构数据进行协同聚类后,可以得到一种聚类结构,其中每一类包含多种异构数据,它们之间可以互为标签,标签可读性高。实验结果证明,该方法是一种切实可行且效果优异的数据聚类算法。  相似文献   

5.
潘振君  梁成  张化祥 《计算机应用》2021,41(12):3438-3446
针对多视图数据分析易受原始数据集噪声干扰,以及需要额外的步骤计算聚类结果的问题,提出一种基于一致图学习的鲁棒多视图子空间聚类(RMCGL)算法。首先,在各个视图下学习数据在子空间中的潜在鲁棒表示,并基于该表示得到各视图的相似度矩阵。随后,基于得到的多个相似度矩阵学习一个统一的相似度图。最后,通过对相似度图对应的拉普拉斯矩阵添加秩约束,确保得到的相似度图具有最优的聚类结构,并可直接得到最终的聚类结果。该过程在一个统一的优化框架中完成,能同时学习潜在鲁棒表示、相似度矩阵和一致图。RMCGL算法的聚类精度(ACC)在BBC、100leaves和MSRC数据集上比基于图的多视图聚类(GMC)算法分别提升了3.36个百分点、5.82个百分点和5.71个百分点。实验结果表明,该算法具有良好的聚类效果。  相似文献   

6.
基于DNA计算的层次图聚类算法   总被引:1,自引:0,他引:1       下载免费PDF全文
薛洁  刘希玉 《计算机工程》2012,38(12):188-190
为解决使用DNA计算图聚类问题,提出一种基于DNA计算的层次图聚类算法。在分裂层次聚类中,使用DNA分子对图中顶点、边进行编码,在试管中并行产生最小生成树,根据给定阈值,通过切割树枝得到聚类结果。在凝聚聚类中使用DNA计算产生哈密尔顿路径,通过寻找最短哈密尔顿路径得到聚类结果。实验结果验证了该算法的可行性。  相似文献   

7.
根据聚类假设,提出一种新的基于图的半监督学习算法,称为密度敏感的半监督聚类。该算法引入一种密度敏感的距离测度,它能较好地反映聚类假设,并且充分挖掘了数据集中复杂的内在结构信息,同时与基于图的半监督学习方法相结合,使得算法在聚类性能上有了显著的提高。经过实验仿真进一步表明,该算法在特定图像应用上具有优越性。  相似文献   

8.
李小红  罗敏 《计算机科学》2012,39(9):162-165
提出了一种新的基于图划分的聚类算法——GAGPBCUK算法。该算法解决了谱聚类算法参数敏感和聚类结果不准确等问题。3组仿真实验结果表明,GAGPBCUK算法不仅在识别和学习数据集中的隐含聚类数方面具有很好的性能,而且能够得到比谱聚类算法(NJW算法)更加有效的聚类结果。  相似文献   

9.
每一种聚类算法都有其适合处理的特定分布的数据集.为了给未知分布数据集挑选合适的聚类算法,提出了一种挑选聚类算法的网格连通图方法 SCGG.SCGG通过对数据潜在类结构的分析,若含有环形结构类则选择层次聚类的单连接算法对数据聚类,否则选择k-means算法.实验显示该方法十分的有效,能够挑选到合适的聚类算法对数据聚类.  相似文献   

10.
刘娟  万静 《计算机科学与探索》2021,15(10):1888-1899
密度峰值聚类算法是一种基于密度的聚类算法.针对密度峰值聚类算法存在的参数敏感和对复杂流形数据得到的聚类结果较差的缺陷,提出一种新的密度峰值聚类算法,该算法基于自然反向最近邻结构.首先,该算法引入反向最近邻计算数据对象的局部密度;其次,通过代表点和密度相结合的方式选取初始聚类中心;然后,应用密度自适应距离计算初始聚类中心之间的距离,利用基于反向最近邻计算出的局部密度和密度自适应距离在初始聚类中心上构建决策图,并通过决策图选择最终的聚类中心;最后,将剩余的数据对象分配到距离其最近的初始聚类中心所在的簇中.实验结果表明,该算法在合成数据集和UCI真实数据集上与实验对比算法相比较,具有较好的聚类效果和准确性,并且在处理复杂流形数据上的优越性较强.  相似文献   

11.
测试数据自动生成是软件测试的基础,也是测试自动化技术实现的关键环节。为了提高测试自动化的效率,在 结合 测试数据自动生成模型的基础上,提出一种 传统遗传算法的改进算法。该算法使用了自适应交叉算子和变异算子,并引入模拟退火机制对其进行改进。同时,该算法还对适应度函数进行了合理的设计,以加速数据的优化过程。通过三角形程序、折半查找和冒泡排序程序,与基本遗传算法、自适应遗传算法进行了比较与分析,并且对改进算法做了性能分析。实验结果表明了该算法的实用性以及在测试数据生成中的可行性和高效性。  相似文献   

12.
为提高粒子群算法的优化效率,在分析粒子群优化算法的基础上,提出了一种基于Bloch球面坐标编码的量子粒子群优化算法。该算法每个粒子占据空间三个位置,每个位置代表一个优化解。采用传统粒子群优化方法的搜索机制调整量子位的两个参数,可以实现量子位在Bloch球面上的旋转,从而使每个粒子代表的三个优化解同时得到更新,并快速逼近全局最优解。标准测试函数极值优化和模糊控制其参数优化的实验结果表明,与同类算法相比,该算法在优化能力和优化效率两方面都有改进。  相似文献   

13.
基于退火免疫遗传算法的测试用例生成研究   总被引:2,自引:0,他引:2  
在软件测试技术中,高效的测试用例生成是简化测试工作、提高测试效率的必要手段.提出了一种应用于软件测试中的基于退火免疫遗传算法(AIGA)的测试用例自动生成算法,介绍了AIGA测试用例生成模型和AIGA算法的基本思想.算法融合了模拟退火算法和免疫算法在避免陷入局部最优和保持种群多样性方面的优势,克服遗传算法局部搜索能力差及其早熟现象和模拟退火算法全局搜索能力差、效率不高的问题.实验结果表明,算法在测试用例自动生成的效率和效果方面.优于传统遗传算法.  相似文献   

14.
为了进一步提高速度受限的多目标粒子群算法(SMPSO)求解多目标优化问题的效率和精度,文中提出基于消息传递接口(MPI)的并行化SMPSO算法(M-SMPSO).采用主从模式的MPI并行程序设计模式,将整个种群分成几个子种群,各子种群分别执行独立进化计算,提高算法效率.此外,为了均衡考虑算法的分布性与收敛性,提出自适应的全局最优解选择策略.使用标准测试函数验证算法性能,实验表明,相比其它多目标算法,文中算法能获得更高的加速比,更快收敛到多目标优化问题的Pareto前沿.  相似文献   

15.
针对飞针测试机检测电路板时检测时间长、测试效率低、单针检测容易撞针等问题,提出了一种基于改进粒子群算法的测试路径规划算法.首先,使用分区检测的方式解决两针相撞问题;其次,提出一种改进的粒子群算法,在粒子群算法的基础上加入混沌初始化公式用于约束和更新搜索的最大速度,引入遗传算法的交叉、变异的思想,改进粒子群算法易于趋于局部最优的缺陷,提升了算法的全局搜索能力.与粒子群算法、遗传算法进行有效性的对比分析与实机测试.结果表明:此算法可以有效解决测试时两针相撞问题;比起其他两种算法改进粒子群算法在更少的迭代数的同时全局搜索能力更强,可以减少30%算法运算时间、降低10%的测试距离,具有一定的工程应用价值.  相似文献   

16.
一种随机粒子群算法及应用   总被引:2,自引:0,他引:2  
为提高粒子群算法的优化效率,在分析量子粒子群优化算法的基础上,提出了一种随机粒子群优化算法。该算法只有一个控制参数,搜索步长由一个随机变量的取值动态决定,通过合理设计控制参数的取值,实现对目标位置的跟踪。标准测试函数极值优化和聚类优化的实验结果表明,与量子粒子群和普通粒子群算法相比,该算法在优化能力和优化效率两方面都有改进。  相似文献   

17.
分析了不同测试项目对于一款采用0.18μm工艺流片的高性能通用处理器芯片失效的发现能力.以失效分析的数据作为基本数据结构,提出了测试项目有效性和测试项目耗费时间的折中作为启发式信息的优化算法,利用该算法生成的测试流程可以减少失效芯片的测试时间.该算法和动态规划算法相比,计算复杂度从O(dn^2n)降低到O(dn^3).最后用实验数据证明了该算法的有效性.  相似文献   

18.
为提高智能组卷的效率,提出一种求解组卷问题的带自适应变异的量子粒子群优化(AMQPSO)算法。首先在算法中嵌入有效判断早熟停滞的方法,一旦检索到早熟迹象,根据构造的变异概率对粒子进行变异使粒子跳出局部最优;其次基于项目反应理论,构建分步组卷问题的数学模型,减少组卷冗余度和提高组卷效率。仿真实验表明,与遗传算法相比,所提出的算法在组卷成功率和组卷质量方面均具有更好的性能。  相似文献   

19.
为了提高回归测试用例集的测试效率和有效性,提出由需求得到回归测试用例排序技术及其实现算法。由需求得到回归测试用例排序技术,将与软件需求相关的需求描述度、需求实现复杂度、需求稳定度和需求覆盖度等因素应用于测试用例排序,以缺陷检测加权平均百分比作为度量标准。通过实验,比较排序后用例和未排序用例缺陷检测情况,实验结果表明该技术排序后的回归测试用例集,能够尽早地发现更多的软件错误,有效提高回归测试效率,保证软件质量。  相似文献   

20.
诊断驱动测试是一种智能测试模式,可以有效缩短测试时间,提高维护效率。故障字典是一种传统的故障诊断方法,大量地应用于生产生活中。本文根据诊断驱动测试模式的需求,设计了故障字典的新推理算法,并提出了测试项目的优选原则。本文提出的方法已经在自动测试设备的软件平台上得到了实现和验证。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号