首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 234 毫秒
1.
提出了一种基于相对熵和子空间二次过滤的CLIQUE改进算法。该算法根据数据的分布情况对每一维采用自适应的网格划分方法,减少了全空间中网格单元的数量,降低了算法的时间复杂度。算法采用了基于维关联度的子空间二次过滤策略,提高了聚类结果的准确性。实验使用仿真数据表明,该算法在精度,时间复杂性等方面的表现优越。  相似文献   

2.
为使多路谱聚类方法对复杂结构数据集有效地聚类,根据矩阵扰动理论,利用局部近邻关系更新谱聚类算法(NJW)中的初始相似度矩阵,得到最终的亲和矩阵.理论分析表明,数据集可划分时,该矩阵是理想块矩阵或接近理想块矩阵,保证了本文算法聚类划分的正确性.将本文算法和基于路径的谱聚类、密度敏感的谱聚类以及基于流平面排序的谱聚类进行了比较,结果表明,本文算法在数据集具有复杂分布结构时可以确定聚类个数,得到正确的聚类结果.进一步将本文算法用于真实数据集上的聚类分析,表明本文算法是有效的.  相似文献   

3.
针对海量实时数据流,提出了一种基于密度和网格划分相结合的聚类算法.首先对数据空间进行划分,判断每个单元格中数据点的属性.如果单元格内数据点密度高于阈值,则判定这些点为核心点;否则,根据单元格邻居内数据点的数量对数据点进行再次判断,以确定单元格内的数据点是边界点还是噪声点.算法克服了基于密度的算法运行效率低的缺点,又弥补了基于网格的算法精度较低的不足.通过实验验证了算法的效率和性能,并与经典的DBSCAN和CLIQUE算法进行了对比分析.最后分析了算法在面向海量实时数据流方面所具有的优势,并提出了进一步的研究方向.  相似文献   

4.
基于类云模型聚类的多目标数据关联算法   总被引:2,自引:0,他引:2  
针对多目标跟踪中的数据关联问题,提出一种基于类云模型c-均值聚类的数据关联算法.该算法采用类云模型c-均值聚类算法对目标有效回波进行聚类,将聚类中心作为目标最终观测值,运用最近邻法对聚类中心与航迹进行关联,用Kalman滤波器进行状态估计.实验结果表明,本算法与联合概率数据互联算法相比,跟踪精度高,计算量小,更适应于工程应用.  相似文献   

5.
结合基于视觉原理的密度聚类算法对初始化参数不敏感、能发现任意形状的聚类、能够找出最优聚类及一趟聚类算法快速高效的特点,研究可以处理混合属性的高效聚类算法.首先简单改进基于视觉原理的密度聚类算法,使之可以处理含分类属性的数据,进而提出一种两阶段聚类算法。第一阶段使用一趟聚类算法对数据集进行初始划分,第二阶段利用基于视觉原理的密度聚类算法归并初始划分而得到最终聚类。在真实数据集和人造数据集上的实验结果表明,提出的两阶段聚类算法是有效可行的。  相似文献   

6.
DBSCAN算法是一种典型的基于密度的聚类算法,具有速度快、可以发现噪声的优点,但在处理大规模数据时出现聚类效率低、内存和I/O消耗大、聚类精度降低的问题,集群式计算机技术特别是云计算技术的发展提供了解决DBSCAN算法缺陷的方案.文中提出了数据预分区的并行PMDBSCAN算法,该算法在聚类之前对数据分区预处理,利用并行编程模型MapReduce实现DBSCAN算法并行化,结合重叠分区思想,减少I/O消耗.实验结果表明,在大规模数据集上,PMDBSCAN算法聚类有效提高了聚类的速度、减少了I/O消耗、改善了聚类的质量.  相似文献   

7.
地震相识别是根据地震数据内部结构,将之划分为不同的地震相结构单元.本文研究基于半监督核均值漂移聚类的地震相自动识别算法,有效结合了半监督学习和核均值漂移聚类的优势,不用人为给定聚类个数,并且在聚类过程中方便引入少量地震相先验信息,从而有效提升地震相识别的准确性.理论数据聚类展示了该算法对地震相中的多个结构单元识别准确度较高.北海F3实际数据聚类结果表明,本文算法可以得到合理的地震相个数,与其它六种聚类算法的结果相比,本算法划分的地震相结构层次分明且能够区分细小微层.  相似文献   

8.
为有效检测聚类的边界,提出了一种基于局部质变因子的聚类边界检测算法(BRINK).该算法使用加权欧式距离技术解决现有聚类边界检测算法不能适用于高维数据的问题,根据局部质变因子在聚类的边界具有稍大于1的特征来识别聚类的边界.实验结果表明,该算法能有效的检测出聚类的边界.  相似文献   

9.
提出了一种改进的基于粒子群优化的快速K均值算法,有效克服了K均值算法对初始聚类中心敏感和容易陷入局部最优从而影响聚类效果等缺点.与已有的粒子群优化聚类算法相比,该算法通过对样本各维属性进行规范化,预先计算样本的相异度矩阵,提出了一种简化的粒子的编码规则,基于相异度矩阵进行粒子群优化K均值聚类,在保证聚类效果的基础上,有效降低了计算的复杂度.在多个UCI数据集上的实验结果表明,该算法是有效的。  相似文献   

10.
聚类是一种重要的数据分析与预处理技术.与传统的静态聚类分析方法相比,基于同步模型的聚类算法属于一种动态演化的聚类分析技术.先提出了应用到聚类中的两种指数衰减加权同步模型和一种δ近邻指数衰减加权同步模型.对前两种同步模型,提出了基于指数衰减加权同步模型的聚类算法;对后一种同步模型和已发表的扩展Kuramoto模型、Vicsek简化模型及Vicsek模型的一个线性版本,提出了基于近邻同步模型的聚类算法.然后比较分析了这些同步聚类模型的算法复杂度、性质及特点.在人工数据集和8个UCI数据集的仿真实验中,对这几种同步聚类模型在聚类精度、聚类速度等方面进行了适当的比较.最后对基于同步模型的聚类算法的发展进行了总结及展望.  相似文献   

11.
结合人工神经网络中的自适应共振理论(ART)及数据挖掘(Data Mining)技术来建构一个可自动聚类族群特征且能挖掘出关联特质的自动化在线推荐系统。探讨如何有效地运用数据挖掘技术从大量的数据库中挖掘出完整知识,以推荐适当的信息给使用者,帮助他们在浩大的信息流中找到真正需要、有用的文件或信息。整合ART及数据挖掘技术,并针对推荐系统的特性提出一种改进的ART算法(MART算法)。实例验证了算法的有效性。  相似文献   

12.
基于核方法的模糊聚类算法   总被引:31,自引:0,他引:31  
将核方法的思想推广到模糊C-均值算法,构造了基于核函数的模糊核C-均值算法,使其能够聚类非超球体数据、被噪声污染数据、多种模式原型混合数据、不对称数据等多种数据结构,并指出一阶多项式模糊核C-均值算法等价于模糊C-均值算法.人工和实际数据的实验结果表明,与模糊C-均值算法相比,模糊核C-均值算法在多种数据结构条件下可以有效地进行聚类.  相似文献   

13.
为了减少基于密度的异常点检测算法邻域查询操作的次数,同时避免ODBSN(Outlier Detection Basedon Square Neighborhood)中有意义异常点的丢失和稀疏聚类中的对象靠近稠密聚类时导致错误的异常点判断,提出了一种基于邻域和密度的异常点检测算法NDOD(Neighborhoodand Densitybased Outlier Detection)。NDOD吸收基于网格方法的思想,以广度优先扩张方形邻域,成倍地减少了邻域查询的次数,从而快速排除聚类点并克服基于网格方法中的“维灾”。新引入的基于邻域的局部异常因子代表候选异常点的异常程度,用于对候选异常点的精选,可避免ODBSN的缺陷,发现更多有意义的异常点。大规模和任意形状的二维空间数据的测试结果表明,该算法是可行有效的。  相似文献   

14.
服务器集群技术是解决目前网络计算瓶颈的一种有效方案,负载均衡技术是其中的关键.对Linux虚拟服务器集群的结构与原理进行讨论,重点阐述了基于网络地址转换(NAT)的负载均衡技术以及满足不同应用需要的4种负载均衡算法,并在Linux操作系统环境下构建了虚拟服务器集群,测试了负载响应、服务性能、调度器备份.结果表明,基于IP层的负载均衡技术是有效的,集群技术较大幅度地提高了系统的综合性能.  相似文献   

15.
针对K-means异常检测算法检测性能低的问题,提出了一种结合信息熵与改进K-means算法的异常检测算法。该算法均匀地选出密度大于数据集平均密度的数据对象作为初始聚类中心,避免了初始中心的随机选择。在此基础上,引入了信息熵确定属性权重的方法来计算簇中数据点与该簇聚类中心的加权欧氏距离,通过对比簇中数据点的加权欧氏距离与该簇中所有数据点的平均加权欧氏距离来进行异常检测。实验表明,改进算法具有更高的检测率和更低的误检率,应用于电力负荷数据时检测率达到了90. 5%,能够有效地检测出异常的负荷数据。  相似文献   

16.
针对目前入侵检测技术训练时处理类别型数据能力欠缺、误报率高的问题,提出一种处理混合型属性的无监督异常入侵检测方法,定义了类别型属性各取值之间的差异度,使得在对训练集进行无监督学习、生成检测模型过程中,能够同时有效地处理数值型属性和类别型属性.理论分析表明所定义的类别型属性值差异度既保留了类别型属性各取值之间的本质特征.同时也没有改变数据集的原始维数.实验中采用了网络入侵检测数据集KDD-CUP-99来训练模型.实验结果表明,采用的混合型属性处理方法进行聚类所建立的入侵检测模型,与现有方法相比,检测率高.  相似文献   

17.
基于核化原理,提出核最优变换与聚类中心算法.算法通过非线性变换,将数据映射到核空间,并在核空间中执行最优变换与聚类中心算法.该算法可提取稳健的非线性鉴别特征,解决复杂分布数据的模式分类问题.同时,基于训练样本在核空间所张成的子空间的一组基,提出一个快速提取鉴别特征的计算方法,解决了一般核方法面临的“大训练集”难题.基于IRIS,YEAST,GLASS等数据的分类实验验证了该方法的有效性.  相似文献   

18.
提出了一种基于特征加权的IB算法-wsIB算法,该算法融入了ReliefF算法,对特征进行加权,抑制了冗余特征,强化了有效特征.在加权变换后的特征空间中进行聚类,实验结果表明,该算法优于sIB算法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号