首页 | 本学科首页   官方微博 | 高级检索  
检索     
共有20条相似文献,以下是第1-20项 搜索用时 187 毫秒

1.  混合属性数据流的二重k近邻聚类算法  
   黄德才  沈仙桥  陆亿红《计算机科学》,2013年第40卷第10期
   现有的数据流聚类算法大都只能处理单一数值属性的数据,不能应对同时包含数值属性与分类属性特征的数据,且已存在的混合属性数据流聚类算法在对数据的标准化处理和聚类上还有很大的改进之处,为此,提出二重k近邻混合属性数据流聚类算法.该算法采用CluStream算法的在线、离线框架,并提出了混合属性数据流下三步聚类的思想.算法先运用二重k近邻和改进的维度距离生成微聚类,然后利用动态标准化数据方法和基于均值的余弦模型生成初始宏聚类,最后利用基于均值的余弦模型和先验聚类结果进行宏聚类优化.实验结果表明,所提出的算法具有良好的聚类质量及可扩展性.    

2.  一种基于网格和最小生成树的数据流聚类算法  
   王海波  王宪鹏  王芳  陈志国《计算机系统应用》,2011年第20卷第2期
   针对CluStream 算法对非球状簇聚类的不足,同时基于均匀网格划分的聚类算法多数是以降低聚类精度为代价来提高聚类效率,给出了一种新的数据流聚类算法—GTSClu 算法,该算法是基于网格的最小生成树(MST)数据流聚类算法。算法分为在线处理与离线聚类两部分,并运用了网格拆分与最小生成树技术,可以有效排除噪声数据,发现任意形状的聚类,实验证明提高了聚类效率和质量。    

3.  基于小波分析的数据流聚类算法  
   杨启仁  王娟  张科  任达森《煤炭技术》,2010年第29卷第10期
   结合CluStream处理数据流的框架,提出了一种基于小波分析的数据流聚类算法WDS。在分解后的低频子波中利用小波特性寻找密集区域,并结合了CluStream的在线微聚类和离线宏聚类两个过程来处理数据流。WDS算法在聚类时无需预先指定聚类数目,有效地解决了聚类算法参数敏感的问题。    

4.  一种基于Hash函数抽样的数据流聚类算法  被引次数:1
   张驹  黄汉永  肖杰《计算机系统应用》,2009年第18卷第3期
   近几年来由于数据流应用的大量涌现,基于数据流的数据挖掘算法已成为重要的研究课题,而现有的数据流聚类算法Clustream算法存在效率低,对大数据集适应性差等严重不足,本文提出了一种基于Hash函数抽样的数据流聚类算法。算法采用等时间跨度滑动窗口的思想,对每个窗口内的数据首先用Hash函数进行抽样,抽样后的数据先保存在存储池中,然后分析样本数据的变化情况,再利用PAM算法得到最终的聚类结果。从对真实数据集的实验结果上来看,算法具有良好的可行性和有效性,且在大规模数据处理的情况下,效率远高于Clustream    

5.  基于网格的数据流聚类算法  被引次数:2
   刘青宝  戴超凡  邓苏  张维明《计算机科学》,2007年第34卷第3期
   本文提出的基于网格的数据流聚类算法,克服了算法CluStream对非球形的聚类效果不好等缺陷,不仅能在噪声干扰下发现任意形状的类,而且有效地解决了聚类算法参数敏感和聚类结果无法区分密度差异等问题。    

6.  基于密度的混合属性数据流聚类算法  被引次数:1
   黄德才  吴天虹《控制与决策》,2010年第25卷第3期
   数据流聚类分析是当前数据挖掘研究的热点问题,为了克服数据流聚类框架CluStream算法不能处理混合属性数据流的缺陷,提出了基于密度的混合属性数据流聚类算法MCStream.在微聚类中使用面向维度的距离来度量对象之间的相似度,在宏聚类中使用改进的密度聚类算法M-DBSCAN对微簇进行聚类.实验结果表明,MCStream算法能快速有效地处理混合属性数据流聚类问题.    

7.  一种基于滑动窗口的流数据聚类算法  
   蔡妮明  王翰虎  陈梅《计算机技术与发展》,2011年第21卷第1期
   在实际应用中,人们往往比较关心最近一段时间内数据流的分布状况.在传统的基于界标模型的聚类算法CluStream中,没有淘汰过期元组,不能准确反映当前数据流的数据分布状况.滑动窗口是数据流中一种关注近期数据的近似方法.为了提高对流数据聚类分析的质量及效率,对算法clustream进行了改进,采用滑动窗口来支持数据处理.为了减少聚类操作中每次迭代的计算次数,算法采用改进的k-means来执行聚类操作.优化后的算法能及时淘汰过期元组,同时对新到达的元组不断进行实时处理,可以获得更准确的分析结果.与聚类算法CluStream相比,优化算法可获得较小的内存开销和快速的数据处理能力,聚类结果更合理清晰.    

8.  数据流的不规则网格增量聚类算法  
   于翔  印桂生《哈尔滨工程大学学报》,2008年第29卷第8期
   分析了数据流的特点,针对数据流聚类算法CluStream对数据流中非球形聚类效果不好的情况,提出了基于数据流的不规则网格增量聚类算法IIGStream.IIGStream算法具备了传统网格聚类算法处理速度快的优点.同时能够动态增量地调整网格结构.对新到来的数据点,通过判断网格是否相连,保证了对于不同形状聚类的聚类效果.IIGStream在聚类时无需预先指定聚类数目.且对孤立点不敏感.在真实数据集与仿真数据集上的实验结果表明,IIGStream算法具有良好的适用性和有效性,在聚类精度以及速度上均优于CluStream算法.    

9.  分布式密度和中心点数据流聚类算法的研究  被引次数:1
   高宏宾  侯杰  刘劲飞《计算机应用与软件》,2013年第10期
   分析分布式数据流聚类算法的基本框架结构,针对CluStream算法对非球形聚类效果不佳提出一种基于密度和中心点的分布式数据流聚类算法DDCS-Clustering(Distributed Density and Centers Stream Clustering)。该算法应用密度、中心点与衰减时间窗口,在分布式环境下对数据流进行聚类。实验结果表明,DDCS-Clustering算法具有较高的聚类质量与较低的通信代价。    

10.  基于Hadoop MapReduce的分布式数据流聚类算法研究  
   《信息工程大学学报》,2014年第15卷第4期
   随着数据流规模的持续增大,现有基于网格的聚类算法对数据流的聚类效果不好,不能实时发现任意形状的簇,也不能及时删除数据流中的噪声点。文章提出了一种Hadoop平台环境下基于网格密度的分布式数据流聚类算法(PGDC Stream),利于基于Hadoop的MapReduce框架对数据流进行阶段化的并行聚类分析,实时发现数据流中任意形状的簇,定义检测周期和密度阈值函数并及时删除数据流中的噪声点。算法基于网格密度对数据流初始聚类后,随着新数据的到来,使用基于密度阈值函数的噪声点处理策略,周期性检测和删除噪声点,使用基于Hadoop MapReduce框架的并行分析模型周期性地调整已经生成的簇。实验结果表明,PGDC Stream对大规模数据流的聚类质量、可伸缩性和实时性都好于CluStream。    

11.  在数据流数据库中集成聚类算法研究与实现  
         《计算机应用研究》,2014年第31卷第5期
   在数据流管理系统中集成数据挖掘功能,有助于对数据流进行更加有效的管理和挖掘,但目前研究界对此方面工作关注不够。基于数据流管理系统Esper,利用时间窗口和自定义函数,采用Esper处理语言改写Clustream算法,在Esper系统中实现聚类算法。实验结果表明,该方法可以Esper具有对数据流进行聚类分析的能力;与用Java实现数据流聚类相比,在Esper中实现聚类方法具有更好的处理多维大数据量数据流的能力。    

12.  具有资源约束的自适应聚类算法  
   王小妮《计算机工程与设计》,2015年第36卷第1期
   为有效考虑大数据流环境中设备节点的内存、计算处理能力、电池电量等资源有限的问题,分析在资源约束的情况下,快速有效挖掘抽取知识的方法,并在K-means算法的基础上提出DRA-Kmeans聚类算法.结合基于资源约束的自适应聚类算法框架RA-Cluster算法,引入自适应聚类方法,对数据流聚类算法CluStream进行改进.该算法在资源受限时优化聚类有效范围,加大聚类精确度;增大聚类半径阈值,抑制新聚类的生成,减少有限资源消耗.    

13.  基于相对密度的数据流模糊聚类算法  
   刘青宝  王文熙  马德良《计算机科学》,2010年第37卷第8期
   提出的基于相对密度的数据流模糊聚类算法结合了相对密度聚类和模糊聚类的优点,能形成任意形状、多密度分辨率的层次聚类结果.同时,利用微簇空间位置重叠关系,定义了微簇集合间的差运算,从而有效地支持了用户指定时间窗口内的数据流聚类要求.通过与CluStream算法在聚类质量和处理时间两个方面的比较分析,发现基于相对密度的数据流模糊聚类算法具有明显的优势.    

14.  数据流的网格密度聚类算法  被引次数:1
   屠莉  陈崚  邹凌君《小型微型计算机系统》,2009年第30卷第7期
   提出一种基于密度的实时数据流聚类算法RTCS.算法采用在线/离线双层框架,它在前台在线层快速实时地将到达的数据点放入相应的单元格,对多维数据和空间单元格动态计算密度.在后台离线层形成初始聚类,并不断地更新单元格的密度来自适应地调整聚类.RTCS算法能够根据密度的动态变化区分出真正的孤立点并剔除之,而这种剔除对后面的聚类结果没有影响.实验结果证明,算法可以很好地挖掘出各种形状的聚类,与CluStream算法相比,取得聚类的质量更高,有更快的处理速度,对数据维数和规模有更好的可扩展性.    

15.  基于双层网格和密度的数据流聚类算法  
   王治和  杨晏《计算机工程》,2014年第4期
   传统的基于网格的数据流聚类算法在同一粒度的网格上进行聚类,虽然提高了处理速度,但聚类准确性较低。针对此问题,提出一种新的基于双层网格和密度的数据流聚类算法DBG Stream。在2种粒度的网格上对数据流进行聚类,并借鉴CluStream算法的思想,将聚类过程分为2个阶段。在线过程中利用粗粒度的网格单元形成初始聚类,离线过程中在细粒度网格单元上,对位于簇边界的网格单元进行二次聚类以提高聚类精度,并实现了关键参数的自动设置,通过删格策略提高算法效率。实验结果表明,DBG Stream算法的聚类精确度较D Stream算法有较大提高,有效解决了传统基于网格聚类算法的聚类精度较低的问题。    

16.  一种基于密度和滑动窗口的数据流聚类算法  
   胡睿  林昭文  柯宏力  马严《计算机科学》,2011年第38卷第5期
   总结目前主流数据流聚类算法的优缺点后,提出了一种新的数据流聚类算法------DsStrcam。该算法采用双层聚类框架,应用滑动窗口技术,基于密度对数据流进行动态聚类,可以挖掘具有任意形状的数据流,且能够动态掌握数据流的分布特征。    

17.  基于数据流的聚类分析算法研究  
   唐培霞  刘希玉《信息技术与信息化》,2007年第6期
   文章研究和分析了数据流上几种典型的聚类分析算法,分析了这几种算法的优点和不足。研究了现在数据流聚类分析的现状,指出未来发展方向。    

18.  基于衰减滑动窗口数据流聚类算法研究  被引次数:2
   朱琳  刘晓东  朱参世《计算机工程与设计》,2012年第33卷第7期
   数据流具有数据流量大、流量连续且快速、难以存储和恢复等特性,其挖掘质量和效率是检验挖掘算法的重要标准.传统的数据流聚类挖掘算法是基于界标窗口、滑动窗口和衰减窗口模型,其算法的聚类质量较差,时间复杂度高等不足,就此类问题,研究一种滑动衰减窗口的数据流聚类算法,并对算法进行了设计与实现,有效的改善传统数据流算法聚类质量和时间效率的问题.仿真实验结果表明了该算法的有效性,达到了较满意的效果.    

19.  汽轮机能耗性能的聚类监测方法  
   潘秀兰  顾慧  司风琪  史泽渊《能源研究与利用》,2016年第4期
   文中对汽轮机能耗性能的聚类监测方法—Clustream数据流聚类算法进行了分析研究,该算法在处理热工过程海量数据时,能够充分利用历史数据,实时更新系统特性,减少聚类时间,这样有利于工业生产,特别是电站能耗特性的实时更新。机组能耗特性曲线是负荷优化分配的前提和基础,不仅与机组自身有关,而且受环境、运行方式、设备状态、运行人员的技术水平以及煤种等因素影响。以某电厂超临界600 MW机组为例,从现场海量数据中提取出的与汽轮机热耗率相关的主要特征信息,利用Clustream的算法对影响汽机热耗率的重要参数聚类。研究表明,采用文中方法能够准确地诊断出汽轮机性能在较长时间后的变化情况及规律,它对电厂实际操作运行提供参考。    

20.  实时数据流聚类的研究新进展  
   张晓龙  曾伟《计算机工程与设计》,2009年第30卷第9期
   实时数据流聚类是目前国际数据库和数据管理领域的新兴研究热点.综述了实时数据流聚类的最新研究进展,在介绍实时数据流聚类的相关理论和常用技术的基础上,对现有各种代表性算法的优势和不足进行了系统地分析,从处理速度、聚类形状、演化分析、高维性及噪声健壮性5个方面对算法的性能进行了比较.探讨了基于聚类的实时数据流演化分析方法及其局限性.最后展望了将来可能的研究方向.    

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号