首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 93 毫秒
1.
樊仲欣  王兴  苗春生 《计算机应用》2019,39(4):1027-1031
为解决利用层次方法的平衡迭代规约和聚类(BIRCH)算法聚类结果依赖于数据对象的添加顺序,且对非球状的簇聚类效果不好以及受簇直径阈值的限制每个簇只能包含数量相近的数据对象的问题,提出一种改进的BIRCH算法。该算法用描述数据对象个体间连通性的连通距离和连通强度阈值替代簇直径阈值,还将簇合并的步骤加入到聚类特征树的生成过程中。在自定义及iris、wine、pendigits数据集上的实验结果表明,该算法比多阈值BIRCH、密度改进BIRCH等现有改进算法的聚类准确率更高,尤其在大数据集上比密度改进BIRCH准确率提高6个百分点,耗时降低61%。说明该算法能够适用于在线实时增量数据,可以识别非球形簇和体积不均匀簇,具有去噪功能,且时间和空间复杂度明显降低。  相似文献   

2.
为实时显示三维数据体的海量数据,提出一种改进的海量数据快速显示算法。利用CURE聚类算法对数据进行整理,通过Hilbert R-tree对数据建立索引,根据可视化区域预测模型预测下一时刻的可视区域,以实现大量数据的快速可视化。实验结果表明,与基于视点运动的快速显示算法和基于可见性判断的可视化算法相比,该算法在不降低渲染质量的前提下,渲染速度分别提高18.27%和67.06%,预测区域错误率分别降低9.73%和22.37%,能够快速加载数据并且准确绘制大量三维数据体。  相似文献   

3.
1.引言数据库的查询操作一般依赖于物理层的特殊算法的支持,尤其在许多面向对象和空间数据库的应用领域,如在文献数据库、多媒体数据库、金融数据库、CAD数据库等的检索操作中,都需要特殊检索算法支持对象的相似检索。数据库中的对象常常用高维特征矢量表示,因此对象的相似检索问题实际上归结为高维特征矢量的相似检索问题。由于用于表示对象的多维特征矢量的维数一般都很高(从几十到几百都是可  相似文献   

4.
基于密度的不确定性数据概率聚类   总被引:1,自引:0,他引:1  
近期传感数据监测和移动对象跟踪等许多从自然界直接采集数据的新应用引发了不确定性数据管理这一新的研究课题.这些应用中相关数据的不确定性为传统的数据处理方法提出了新的挑战.探讨的重点是不确定性数据的聚类.提出了一个针对不确定性数据的基于密度的聚类算法,根据不确定性数据内在的概率分布信息进行概率聚类,并采用R树索引和概率阀值索引提高算法的效率.仿真试验表明,提出的算法在有效性和效率方面均优于当前主要的基于密度的不确定性数据聚类算法.  相似文献   

5.
针对DBSCAN聚类算法随着数据量增大,耗时越发非常严重的问题,提出一种基于KD树改进的DBSCAN算法(以下简称KD-DBSCAN).通过KD树对数据集进行划分,构造邻域对象集,提前区分出噪声点和核心点,避免聚类过程中对噪声的邻域集计算以及加快了核心点对象的邻域集查询速度.文中以浮动车GPS数据为实验数据,对比传统D...  相似文献   

6.
在目前聚类方法中, k-means与势函数是最常用的算法,虽然两种算法有很多优点,但也存在自身的局限性。 k-means聚类算法:其聚类数目无法确定,需要提前进行预估,同时对初始聚类中心敏感,且容易受到异常点干扰;势函数聚类算法:其聚类区间范围有限,对多维数据进行聚类其效率低。针对以上两种算法的缺点,提出了一种基于 K-means 与势函数法的改进聚类算法。它首先采用势函数法确定聚类数目与初始中心,然后利用K-means法进行聚类,该改进算法具有势函数法“盲”特性及K-means法高效性的优点。实验对改进算法的有效性进行了验证,结果表明,改进算法在聚类精度及收敛速度方面有很大提高。  相似文献   

7.
FCM算法对初始聚类中心敏感,对噪声和孤立点敏感,容易受到数据分布的影响。本文的改进算法引入物理学上的数据场理论,用势函数来描述数据的分布,优化初始聚类中心;同时采用冗余聚类中心的方法,即将大簇分割成多个小类,再用分离度作为评估函数进行类合并。仿真实验结果表明,改进算法能够克服FCM算法的一些缺陷,对数据分布不规则的数据集进行有效聚类,聚类效果良好。  相似文献   

8.
针对传统K均值聚类方法采用聚类前随机选择聚类个数K而导致的聚类结果不理想的问题,结合空间中的层次结构,提出一种改进的层次K均值聚类算法。该方法通过初步聚类,判断是否达到理想结果,从而决定是否继续进行更细层次的聚类,如此迭代执行,从而生成一棵层次型K均值聚类树,在该树形结构上可以自动地选择聚类的个数。标准数据集上的实验结果表明,与传统的K均值聚类方法相比,提出的改进的层次聚类方法的确能够取得较优秀的聚类效果。  相似文献   

9.
为了弥补传统K-means聚类算法在K值确定和初始中心选择难等方面的不足,基于“合并与分裂”思想,提出一种改进的K-means聚类算法。将数据独立程度概念引入实验数据子集构造理论中,利用独立程度评价属性的重要性;根据点密度将数据集合并为若干类,结合最小支撑树聚类算法与传统K-means聚类算法实现分裂;使用KDD Cup99数据集对改进算法在入侵检测中的应用进行仿真实验。结果表明,改进算法在检测率和误报率方面均优于传统K-means算法。  相似文献   

10.
本文对多媒体图像数据提出一套较灵活的存储、索引查询方式。针对多媒体数据库信息查询通用性的问题,构建了一个较为集成的特征库。针对高维数据查询效率问题,将基于内容、颜色、距离和形状的匹配算法与FNN算法及查找聚类重心的加速检索算法集成于查询检索引擎IRE,使查询更高效、应用更广泛。  相似文献   

11.
一种大规模的递增聚类算法及其在文档聚类中的应用   总被引:2,自引:0,他引:2  
聚类是将数据进行划分,并从中发现有用信息的一种有效手段,它在很多领域都有着非常重要的应用。K均值方法是聚类方法中较常用的一种,但对于大规模的数据,而且有计算资源和时间约束的情况下,K均值方法已不能满足要求。该文提出的CFK-means方法是一种适合于大规模数据的、快速高效的递增聚类方法,它采用了聚类特性(Clus-teringFeatures,CF)结构来表示聚类,能更有效地保留和利用聚类信息。它只需扫描数据一次即可得到聚类划分,所需的计算时间和文件交换时间数倍少于K均值方法,而且聚类的准确度和K均值方法相当。通过对仿真数据和实际文本集数据进行的对比实验证明了CFK-means方法的有效性。  相似文献   

12.
一种面向非规则非致密空间分布数据的聚类方法   总被引:1,自引:0,他引:1  
针对目前很少关注非致密非规则数据聚类的情况,利用蚁群算法具有的组合优化方面的优势,引入近邻函数准则,提出了基于蚁群算法和近邻函数准则的聚类算法,来求解非规则非致密数据聚类问题.实验表明,对于非规则非致密分布数据的聚类问题,该聚类算法可根据连接关系合理地进行聚类,相比K均值算法等其他采用样本距离作为分类指标的聚类方法,可有效降低错聚率,一定程度上较好地解决了这类问题.  相似文献   

13.
旅行商问题(Traveling Salesman Prblem,TSP)是典型的 NP-hard 问题。通过对已有以最近插入法为代表的构造性算法的分析,提出了一种具有多项式时间性能的基于参考点的相邻插入法及其改进策略,其时间复杂度分别为O(n2)和O(n3),同时基于典型算例的仿真研究验证所提出算法的有效性和高效性。  相似文献   

14.
邬春学  许博威  叶胤鹏 《控制工程》2012,19(4):566-569,573
传感器节点体积微小,通常携带能量十分有限的电池。由于传感器节点个数多,成本要求低廉,分布区域广,而且部署区域环境复杂,有些区域甚至是人员不能到达的,所以传感器节点通过更换电池的方式来补充能量是不现实的。如何高效使用能量来最大化网路的生命周期是无线传感器网络面临的首要挑战。为了提高网络的寿命,目前人们已经提出了很多基于网络层的路由协议。比较研究了传感器网络现有的路由协议,参考LEACH分簇算法和MTP协议,提出了一种在MTP协议基础上将LEACH分簇思想引入进来的改进方法,即在基于能量强度将网络节点分层后,再在各层上进行簇区分,均衡各传感器节点的能量来提高网络的寿命。实验表明该路由算法可提高网络寿命。  相似文献   

15.
优化K-means初始聚类中心研究   总被引:2,自引:0,他引:2  
K-means算法因为对初始中心依赖性而导致聚类结果可能陷入局部极小。基于密度的多中心聚类并结合小类合并运算的聚类算法解决了计算空间上的极小化,收敛进度上得到了控制,结果明显优于K-means的聚类结果。算法的每一次迭代都是倾向于发现超球面簇,尤其对于延伸状的不规则簇具有良好的聚类能力。  相似文献   

16.
基于遗传算法的模糊聚类分析   总被引:9,自引:0,他引:9  
模糊C-均值聚类(FCM)应用广泛,但是它容易陷入局部最优,且对初始值很敏感。该文提出了一种基于遗传算法的模糊聚类方法,首先用遗传算法对模糊聚类中聚类中心的个数和聚类中心的选取进行指导,然后利用FCM进行聚类。实验结果表明:该方法可以在一定程度上避免FCM算法对初始值敏感和容易陷入局部最优解的缺陷,使聚类更合理,效果很好。  相似文献   

17.
针对目标密集环境下易出现的误关联问题,提出了ISODATA算法的解决方法.该算法将目标点迹的特征参量构成待分类的样本空间,构建了基于ISODATA算法的模型,利用航迹的历史状态数据进行关联运算,有效地解决了多目标密集环境下的误关联问题,分析了记忆步长与计算量和关联结果的关系.通过仿真研究说明了算法在目标密集环境下的有效性.  相似文献   

18.
李光师  孟祥茹 《计算机工程》2012,38(10):102-104
为防止矢量数据在Oracle Spatial的存储过程中被非法访问,设计一个独立于Oracle的加密系统。以字段作为粒度,利用3DES算法加密空间字段,以确保对矢量数据加密后不会增加额外的存储空间。并提出一种基于DES的R树加密方法,以结点为粒度,采用“重叠”的方式对空间索引进行加密,由此保证加密后R树的完整性,降低每次查询时需要解密的数据量。实验结果证明,该加密系统可以实现对空间数据的透明加/解密,适用于各种基于Oracle的地理信息系统应用,并提供灵活、高效的安全保护。  相似文献   

19.
针对现有空间对象多尺度索引结构聚簇性不高的问题,在R树索引的基础上提出一种基于聚类的空间数据多比例尺索引结构。利用树的层次结构反映空间数据的多比例尺特性,用k-means算法对相同等级的空间对象进行聚类分组,减少空间区域覆盖和重叠。实验结果表明,该方法与基于四叉树的多比例尺索引相比,能有效提高空间数据多比例尺显示的性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号