首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 142 毫秒
1.
当存在噪声和离群点时,k-medoids算法具有较好的鲁棒性,但是对于大数据集,算法的计算代价比较高。CF树是Birch算法中常用的一种结构,对于大数据集的聚类有较好的可伸缩性,但是对于非球形的数据,聚类结果较差。因此,在两种算法的基础上,提出一种基于CF树的k-medoids算法,先用数据集构建CF树,形成微簇,改进了欧式距离计算式,最后使用k-medoids算法对微簇进行聚类。当数据点较多时,改进算法比k-medoids算法运行速度快了近2倍。实验表明,改进算法具有较高的性能和可伸缩性。  相似文献   

2.
一种有效的k-means聚类初始中心选取方法   总被引:5,自引:0,他引:5  
针对传统k-means聚类算法中对初始聚类中心随意选取和人为指定的缺陷,提出一种改进的初始聚类中心的选取方法,利用差异矩阵将新的聚类初始中心计算方法用在传统的k-means算法思想中,对传统的k-means算法进行改进。降低k-means算法的复杂度和对异常点的敏感度,提高算法的可伸缩性。  相似文献   

3.
王翠娥  于晓明 《计算机应用》2010,30(11):3051-3052
针对现有入侵检测算法中普遍存在的对输入顺序敏感的问题,提出了将网格和密度相结合的聚类算法应用到入侵检测中。该算法在CLIQUE基础上进行了改进,将非密集单元向密集单元移动,克服了CLIQUE算法聚类结果精确性不高的缺点。该算法结合了网格聚类的低时空复杂度和密度聚类的良好抗噪性的特点。仿真实验中采用了KDD-CUP99的测试数据集,实验结果证实了该算法的有效性和可行性。  相似文献   

4.
基于改进的凝聚性和分离性的层次聚类算法   总被引:4,自引:0,他引:4  
由于传统的数据聚类算法都是在单一表上进行,因此如何在多表中进行聚类是现在聚类分析的一个新方向.提出了一种基于改进的凝聚性和分离性的层次聚类算法--ICCSH(a hierarchical clustering algorithm based on improved cluster cohesion and separation),该算法首先通过ID传播把关系数据库中的各个表联系起来,再通过计算共享最近邻的相似度和改进的凝聚性算法将数据对象聚类为大量相对较小的子聚类,然后通过计算改进的簇间分离性合并子类来找到真正的结果簇.实验表明,该算法不仅运行时间相对较短,具有较强的可伸缩性,还可以得到较高精确的聚类结果.  相似文献   

5.
基于密度聚类的思想,提出了一种改进的K—means算法。算法吸取密度聚类算法的优点,利用对象的t-邻域密度作为选择初始聚类中心点的条件.选出较优的初始中心点,从而得到较好的聚类效果。通过实验表明,此方法相对于随机选取初始聚类中心点准确率较高、稳定性强、可伸缩性好。  相似文献   

6.
一种存在级不确定数据流聚类算法   总被引:1,自引:0,他引:1  
针对不确定数据流聚类算法——EMicro在聚类结果的精确性和聚类中数据的概率相似度方面的不足,提出一种新基于存在级的不确定数据流算法——UDs Stream。该算法通过设置概率阈值,将不确定性高的点和不确定性低的点分开处理,提高聚类结果的准确性和聚类中数据概率相似度。同时引入窗口和密度的方法,设置动态密度阈值,能够动态掌握数据流的分布特征,使聚类过程有更好的灵活性。实验结果证明,与EMicro相比,UDs Stream算法聚类效果更好。  相似文献   

7.
针对现有很多聚类算法不能有效处理大规模数据的问题,基于微簇和等价连接关系,提出一种能在Hadoop平台实现高效并行化的聚类算法bigKClustering。算法将紧凑的数据抽象成一个向量,然后通过等价关系对这些向量进行连接,得到最终的聚类结果。实验结果表明,bigKClustering算法不仅具有良好的时间效率和聚类效果,而且具有良好的可伸缩性、加速比和时间稳定性。  相似文献   

8.
微阵列技术是后基因组时代功能基因组研究的主要工具。基因表达谱数据的聚类分析对于研究基因功能和基因调控机制有重要意义。针对聚类算法要求事先确定簇的个数、对噪声敏感和可伸缩性差的问题,基于密度聚类算法DBSCAN和共享近邻SharedNearestNeighbors(SNN)的不同的特点,提出了一种新的最近邻先吸收的聚类算法,将其应用于一个公开的酵母细胞同期数据集,并用评价方法FOM将聚类结果与K-means聚类方法的结果进行了比较。结果表明,该文的聚类算法优于其他聚类算法,聚类结果具有明显的生物学意义,并能对数据的类别数作出较好的预测和评估。  相似文献   

9.
自组织映射算法是一种重要的聚类模型,能够有效提高搜索引擎的精确性。为克服自组织映射网络对于初始连接权值敏感的不足,提出一种改进的差分进化和SOM相结合的组合文档聚类算法IDE-SOM,首先引入一种改进的差分进化算法对文档集进行一次粗聚类,旨在对SOM网络的初始连接权值进行优化,然后将这个连接权值初始化SOM网络进行细聚类。仿真实验表明,该算法在F-measure、熵等评价指标上都获得了较好的聚类效果。  相似文献   

10.
传统的可伸缩性聚类算法可扩展性不强、处理孤立点的能力较弱。人工鱼群算法是一种基于动物行为的寻求全局最优算法,将人工鱼群算法应用于Web用户聚类,模仿鱼群的觅食、聚群、追尾和随机行为来构造人工鱼,通过鱼群每个个体的局部最优,来找到全局最优值,从而对Web访问用户进行合理聚类。实际运行结果验证了算法的有效性。  相似文献   

11.
改进遗传算法在求解TSP问题上的应用研究   总被引:3,自引:0,他引:3       下载免费PDF全文
遗传算法是一种比较成熟的智能算法,一般通过改进遗传算法的算子达到提高算法性能的目的。提出一种改进的遗传算法,遗传算子是基于近邻选择策略设计的,另外还对评估函数、种群多样性以及保留精英算子等方面对遗传算法进行了改进,并将其应用到旅行商问题的求解上,实验结果表明提出的算法是有效的。  相似文献   

12.
改进的主曲线算法在指纹骨架提取中的应用   总被引:1,自引:0,他引:1       下载免费PDF全文
在指纹识别系统中,指纹骨架的提取是一个重要而困难的环节,传统的细化算法得到的骨架很容易受到噪声的干扰。因此,在研究指纹数据特点和Kégl的主曲线算法的基础上,提出了一种改进的主曲线算法。实验结果表明:改进算法与传统算法相比有着更好的效率和效果,它所提取的指纹骨架包含更多的信息且具有更高的准确性、可靠性和抗噪声性。  相似文献   

13.
为了克服现有方法在求解0-1背包问题时存在的缺陷,提出了一种改进的烟花算法.在给出0-1背包问题的数学模型后,利用Kent混沌映射对基本烟花算法的解初始化以使初始位置分布更加均匀,同时引入Sigmoid函数得到渐变的爆炸半径使得算法的求解精度与搜索速度达到某种平衡,用改进的烟花算法来对其进行求解.通过对典型测试函数和0-1背包问题的求解结果说明了所提出的改进烟花算法求解精度更高,性能更加稳定.  相似文献   

14.
无线传感器网络中由最大连通度生成簇算法得到的簇结构,簇头节点往往负载过重,并且各簇头节点间负载极不均衡,这种不均衡性在传感器节点分布不均匀的场合尤为突出.针对上述问题,提出一种改进的负载均衡分簇算法.通过网关节点调整所属簇使簇间负载趋向均衡,并在调整后将负载依然较大的簇进行分裂,使分簇的逻辑结构适应节点拓扑分布,更加合理.通过仿真实验验证,改进算法在降低和均衡簇头节,占、负载方面比传统的最大连通度分簇算法有明显的提高.  相似文献   

15.
本文利用图论模型的转化,改进传统贪心算法,设计了一种新的求解高校排考问题的图算法.改进后的算法可以更好应对在现实学分制环境下,跨年级、跨专业、主辅修等复杂的选课因素.为了解决传统算法中仅靠人工优化来实现的软约束目标,改进后的图算法首先将排考图着色模型,转化为无向赋权图的分团覆盖模型,通过深度优先策略和赋权机制,求解同时满足排考硬约束条件和软约束条件的排考方案.经过数据验证,改进算法的排考效果,在排考效果上优于传统贪心算法,在时间效率上优于人工排考方式.改进后的新算法在近年我校的期末考务工作中发挥了一定作用.  相似文献   

16.
基于属性重要度的ID3改进算法   总被引:8,自引:0,他引:8  
ID3算法是数据挖掘中最经典的分类算法.该算法偏向于选择取值较多的属性,而属性值较多的属性不总是重要的,从而影响了分类预测的高效性.通过对ID3算法的研究,依据属性重要度粗糙集理论的思想,对经典的ID3算法做了相应的改进,改进后的ID3算法(AIID3),提高了算法的决策效率.最后的实例及应用表明,改进的算法更有效,更快速.  相似文献   

17.
针对Sajjanhar等提出的基于距离聚合向量的图像检索算法的不足,提出一种改进距离聚合向量的图像检索算法。该算法在距离聚合向量的基础上加入最大连通聚合像素平均坐标的质心距离特征,新增的特征向量具有平移、旋转和尺度不变性。对于原聚合向量特征和新增的质心距离特征,分别采用不同的相似性度量函数进行相似度匹配。该改进算法融入比距离聚合向量更多的空间信息。实验结果表明,该算法具有更高的查全率和准确率。  相似文献   

18.
一种改进的XL算法   总被引:1,自引:1,他引:0       下载免费PDF全文
左鑫平  李俊全 《计算机工程》2008,34(19):157-159
对XL算法中的方程组约简过程进行改进,提出一种更有效的求解算法。改进算法中充分利用各单项式之间的约束关系对方程组进行约简,消去其中次数较高的单项式。采用分步扩展及约简的思想消去扩展过程中添加的冗余等式,有效降低XL算法的计算复杂度及存储复杂度。此外,改进的算法还可用于构建布尔函数的低次零化子。  相似文献   

19.
针对改进的模糊C均值聚类算法在进行图像分割时构建的邻域权值函数未能同时考虑空间结构信息和灰度值域信息,而导致对噪声敏感及边缘纹理信息的处理粗糙的问题,提出了一种结合小波变换和改进邻域权值的FCM算法.该算法首先在原始灰度图像的基础上进行小波多分辨率分析的自适应阈值去噪处理;然后在重构图像上结合双边滤波的思想构建一个基于图像块局部空间邻域信息和灰度值域信息的改进邻域权值函数.实验结果表明,该算法比传统FCM算法以及FCM的改进算法有更高的分割精确度,对强噪声更具鲁棒性,图像边缘也更加平整.  相似文献   

20.
温度补偿传统算法没有考虑光纤光栅应变传感器标定状态和实际测试状态的差别,在算法理论上存在不足。为解决这一问题,分析了测试状态下传感器的约束变形特征及温度影响,提出了温度补偿改进算法。通过对改进算法和传统算法的比较分析以及混凝土试块应变测试试验,验证了算法的正确性。理论分析表明,改进算法体现了传感器本身的线膨胀系数和被测结构线膨胀系数的差别所带来的影响,理论上更合理。混凝土试块应变测试试验结果表明,利用改进算法得到的实测应变误差小于4με,而利用传统算法得到的实测应变大于8με。改进算法理论正确,计算结果精度更高,具有工程实用性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号