共查询到18条相似文献,搜索用时 46 毫秒
1.
2.
本论文在对各种算法深入分析的基础上,尤其在对基于密度的聚类算法he基于层次的聚类算法深入研究的基础上,提出了一种全新的基于密度和层次的快速聚类算法。该算法保持了基于密度聚类算法发现任意形状簇的优点,而且具有近似线性的时间复杂性,因此该算法适合对大规模数据的挖掘。理论分析和实验结果也证明了基于密度和层次的聚类算法具有处理任意形状簇的聚类、对噪音数据不敏感的特点,并且其执行效率明显高于传统的DBSCAN算法。 相似文献
3.
《模式识别与人工智能》2014,(5)
层次聚类算法在数据挖掘领域有着广泛应用,现有的层次聚类算法都依赖于对称距离定义.针对聚类对象的非对称距离下的层次聚类展开研究,提出完整的非对称距离下的层次聚类算法,给出聚类对象选择因子,并定义相应的计算方法.文中提出不同簇之间的合并方法,形成非对称距离下的单连接、全连接等算法.采集社会化书签系统中的热点标签,基于共现次数定义非对称距离,对所提出的算法进行大量实验,实验结果表明聚类结果与实际结果具有较高的一致性.对算法进行量化指标分析的结果也表明非对称层次聚类算法具有良好性能. 相似文献
4.
BTS(Best Two Step)聚类算法是结合层次聚类和划分聚类算法的两步聚类算法。层次聚类算法类与类之间不可以对象交换,很容易造成聚类质量不高的结果。而划分聚类对于初始值的设定以及异常噪声数据都很敏感,所以我们研究提出了BTS算法,实验证明BTS算法可达到高质量的聚类效果。 相似文献
5.
由于现有聚类算法不能很好的解决移动环境下移动对象动态变化,本文提出了一种基于层次的移动对象动态聚类算法.该算法通过类中某些特殊点来表示该类,并且记录类合并过程中一些重要特征,使得移动对象动态变化时,简化聚类的过程,从而满足移动环境下对动态聚类算法时间的要求. 相似文献
6.
本文分析了目前信息检索存在的问题,介绍了WEB文本挖掘的概念及处理过程,并提出了两种基于层次聚类的WEB文本挖掘技术并给予分析. 相似文献
7.
为了识别犯罪嫌疑人伪造和篡改的虚假身份,利用树编辑距离计算个体属性相似性,证明了树编辑距离的相关数学性质,对属性应用层次编码方法,提出了一种新的基于树编辑距离的层次聚类算法HCTED(Hi-erarchical Clustering Algorithm Based on Tree Edit Distance)。新算法通过树编辑操作使用最少的代价计算属性相似性,克服了传统聚类算法标称型计算的缺陷,提高了聚类精度,通过设定阈值对给定样本聚类。实验证明了新方法在身份识别上的准确性和有效性,讨论了不同参数对实验结果的影响,对比传统聚类算法,HCTED算法性能明显提高。新算法已经应用到警用流动人口分析中,取得了良好效果。 相似文献
8.
一种基于层次距离计算的聚类算法 总被引:6,自引:0,他引:6
针对广泛存在的层次编码型数据类型,提出了层次距离的新概念,证明了相关的数学性质,并在此基础上提出并实现了新的基于层次距离计算的聚类算法HDCA(Hierarchy Distance Computing based clustering Algorithm).新方法克服了传统聚类算法标称型计算的缺陷,提高了聚类精度.针对聚类算法的中心点问题,提出了相应的层次编码型数据的快速处理算法,并从理论上证明了算法的正确性.实验表明,对比朴素处理算法,HDCA的性能明显提高.新算法已经应用到警用流动人口分析当中,取得了良好效果. 相似文献
9.
10.
11.
基于超图模型的大规模门级网表层次化聚类算法 总被引:2,自引:1,他引:1
为了克服现有层次化方法通用性差、运算效率不高、电路结构提取不准等缺点,提出了一种基于超图模型的层次化聚类算法.首先对网表中最基本的迭代、总线、扇入和串联结构进行自动识别,然后将这4种基本结构按不同的组合方式进行多级聚类,最终建立起了网表的层次化结构.由于文中基本结构聚类算法是专门针对超图数据结构设计的,其时间复杂度较低.实验结果表明,该算法既可以得到较准确的层次信息,又能保证较高的运算速度,对各种应用均有较好的效果. 相似文献
12.
一种改进的BIRCH分层聚类算法 总被引:2,自引:0,他引:2
由于传统的BIRCH算法是用直径来控制聚类的边界,因此如果簇不是球形,它就不能很好地工作,而且传统的BIRCH算法只适用于单表.针对BIRCH的这些缺点,本文提出了一种改进的BIRCH-IBIRCH算法,该算法首先通过ID传播把多个表联系起来,使得BIRCH算法可以适用于多表的情况,再通过计算共享最近邻密度,可以发现任意形状的簇.实验表明,该算法不仅具有较强的可伸缩性,还可以得到较高精确的聚类结果. 相似文献
13.
一种高效的层次聚类分析算法 总被引:4,自引:0,他引:4
层次聚类算法是一类重要的聚类分析方法。传统的层次聚类算法的时间和空间复杂度很大,这使得聚类分析在大型数据集上的应用受到限制。该文提出一种基于重叠区的3阶段改进算法,该算法将大大减少算法的时间复杂度和空间复杂度。 相似文献
14.
15.
边缘检测算法通过识别每个像素在其邻域内灰度的变化而检测出图像的边缘,但由于黄土CT图像的复杂性和随机性,经试验验证,典型的边缘检测算法并不适合直接应用于黄土微结构图像的处理.对边缘检测算法进行了改进并通过VC++6.0平台实现了其功能,首先使用中值滤波和数学形态学方法对图像进行了处理,有效地降低了噪声干扰,净化了背景并增强了图像对比度;然后对图像进行基于Prewitt算法的边缘检测.通过试验验证了改进后的方法可以有效的去除虚假边缘,区分黄土颗粒的形态,从而更清晰地揭示其内部物质的结构.该方法对CT图像处理范畴的拓展,黄土微结构的研究方法和黄土工程性质的判定都有积极的指导意义. 相似文献
16.
随着Internet技术的高速发展,如何从海量的Web信息中快速而有效地获得所需信息也就成为一项重要课题,而数据挖掘技术是解决这一难题的有效办法。其中数据挖掘中的聚类方法是用来发现数据分布的一项重要方法。本文首先阐述了Web挖掘的有关理论,然后针对Web挖掘中的分层聚类法进行了较为详细的论述,最后使用该算法并结合改进的特征权值计算方法和文本相似度的计算方法,建立了训练文本库。 相似文献
17.
18.
一种基于层次聚类的双聚类算法 总被引:1,自引:0,他引:1
双聚类是为了发现基因表达数据矩阵中具有生物意义的矩阵而提出新的聚类方法,目的是通过分别交换行和列,将数据相似的数据聚合在一起组合成子矩阵,这样的子矩阵具有生物意义.本文根据均方残值理论全局优化双聚类,首先用层次聚类算法生成初始的数据矩阵,然后对这些初始的数据矩阵添加行和列,并进行优化生成最终的双聚类.实验表明,该算法能够高效地生成表达水平一致的双聚类,效果令人满意. 相似文献