首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 216 毫秒
1.
耿德志  徐乾 《计算机仿真》2021,38(2):308-312
为了提高高维混合属性数据挖掘效果,提出基于K-Means聚类算法的高维混合属性数据挖掘方法.通过分析数值型数据和分类型数据相似度,获取高维混合属性数据度量标准,将簇中心点设为簇里点的平均数值或质心,引入最大距离自动生成k值策略与坐标转换策略,优化聚类结果;依据欧几里得距离聚类剩余数据,根据最大间距对应的数据中心点坐标与半径,实现数据集聚类划分;通过判定聚类后数据噪音类别,计算各类别中类异常因子,经过降序排列,挖掘并标记异常数据.仿真结果表明,所提方法对高维混合属性数据具有理想的聚类优势与较好的挖掘稳定性.  相似文献   

2.
基于Web日志挖掘的Web文档聚类   总被引:2,自引:1,他引:2  
Web日志挖掘是Web挖掘的一种,介绍了Web日志挖掘的一般过程,研究了k-means聚类算法,并分析了k-means聚类算法的不足.k-means聚类算法迭代过程中每次都需要计算每个数据对象到簇质心的距离,使得聚类效率不高,针对这个问题,提出了k-means聚类算法的改进算法,该算法避免了重复计算数据对象到簇质心的距离,并用这两种算法实现了Web文档的聚类.试验结果表明,该改进算法提高了聚类效率.  相似文献   

3.
K-means算法所使用的聚类准则函数是将数据集中各个簇的误差平方值直接相加而得到的,不能有效处理簇的密度不均且大小差异较大的数据集。为此,将K-means算法的聚类准则函数定义为加权的簇内标准差之和,权重为簇内数据对象数占总数目的比例。同时,调整了传统K-means算法将数据对象重新分配给簇的方法,采用一个数据对象到中心点的加权距离代替传统K-means算法中的距离,将数据对象分配给使加权距离最小的中心点所在的簇。实验结果表明,针对模拟数据集的聚类,改进K-means算法可以明显减少大而稀的簇中数据对象被错误地分配到相邻的小而密簇的可能性,改善了聚类的质量;针对UCI数据集的聚类,改进算法使得各个簇更为紧凑,从而验证了改进K-means算法的有效性。  相似文献   

4.
颜宏文  周雅梅  潘楚 《计算机应用》2015,35(5):1302-1305
针对传统K-medoids聚类算法对初始值敏感、中心点随机选择以及聚类精度不够高等缺点,在粒计算有效初始化的基础上,提出中心点宽度优先搜索策略. 首先,利用粒计算初始化获取K个有效粒子,遴选该K个粒子所对应的K个中心点作为K个初始中心点;然后,根据对象间的相似性分别对K个粒子中的对象建立以中心点为根节点的相似对象二叉树,通过宽度优先搜索遍历二叉树迭代出最优中心点, 同时采用簇间距离和簇内距离优化准则函数. 实验结果表明,所提算法在UCI中Iris和Wine标准数据集中测试,在有效缩短迭代次数的同时保证了算法聚类准确率.  相似文献   

5.
在传统的K-means算法中,聚类结果很大程度依赖于随机选择的初始聚类中心点以及人工指定的k值.为了提高聚类精度,本文提出了利用最小距离与平均聚集度来对初始聚类中心点进行选取,将层次聚类CURE算法得到的聚簇数作为k值,从而使聚类精度得到提高.最后,将改进后的K-means算法应用到微博话题发现中,通过对实验结果分析,证明该算法提高了聚类结果精度.  相似文献   

6.
针对无线传感器网络能量约束特点,为实现节点能耗均衡、最大化网络寿命,提出了一种基于改进粒子群聚类的无线传感器网络能量均衡分簇算法。首先根据距离汇聚节点远近将网络进行区域划分和等级标定,以不同概率确定不同等级区域的分簇数量和规模。在活动等级区域内引入相同数量的粒子,根据K-均值聚类法形成多个初始粒子群,修改带惯性权重的粒子群算法,修改粒子飞行规则,并行智能搜索聚类。多个粒子群体的总结学习等优点加快了聚类收敛速度,克服了对初始聚类中心点选择较敏感的问题,形成了传感器节点位置的最优分簇,避免了网络热点问题,促进  相似文献   

7.
在现实世界中经常遇到混合数值属性和分类属性的数据, k-prototypes是聚类该类型数据的主要算法之一。针对现有混合属性聚类算法的不足,提出一种基于分布式质心和新差异测度的改进的 k-prototypes 算法。在新算法中,首先引入分布式质心来表示簇中的分类属性的簇中心,然后结合均值和分布式质心来表示混合属性的簇中心,并提出一种新的差异测度来计算数据对象与簇中心的距离,新差异测度考虑了不同属性在聚类过程中的重要性。在三个真实数据集上的仿真实验表明,与传统的聚类算法相比,本文算法的聚类精度要优于传统的聚类算法,从而验证了本文算法的有效性。  相似文献   

8.
针对原始kmeans算法对聚类数k很敏感这一问题,设计一种改进的kmeans算法。该算法基于共现词的原理计算词向量之间的相似性,并根据相似性阈值将数据划分为k+x个簇,再将kmeans算法用于k+x个簇中。将改进后的算法应用于文本聚类中,实验结果表明,改进后的算法比原算法聚类准确性更高。  相似文献   

9.
k-means聚类是聚类划分中应用最广泛的一种方案,但是现在许多关于此问题的研究并没有给出近似比为常数的算法.给出了一个随机算法,该算法通过以不同概率选取初始k个点,保证了以一定概率分别属于不同最优聚类簇的k个点.以这k个点作为初始中心点对输入点集进行交换分别执行局部搜索算法,证明了可得到近似比至多为2的解.实验结果表明该算法能够取得较优的近似解结果.  相似文献   

10.
张宇  邵良衫  邱云飞  刘威 《计算机工程》2011,37(15):40-42,45
K-Means算法的聚类结果对初始簇的选择非常敏感,通常获得的是局部最优解而非全局最优解.为此,在K-Means聚类算法基础上,引入组合聚类和竞争学习概念,提出一种基于竞争学习的K质心组合聚类算法CLK-Centroid.该算法采用竞争学习策略计算簇的质心,以适应噪声数据和分布异常数据的要求,使用组合聚类策略提高聚类的...  相似文献   

11.
骆盈盈  陈川  毛云芳 《计算机工程与设计》2007,28(8):1762-1764,1767
现有的传感器网络数据处理系统只能向用户提供简单的查询操作,如何高效地处理传感器网络的海量数据流,从中获取有用的知识成为新的挑战.提出一种基于传感器网络特性的分布式关联规则挖掘算法,采用树型通信结构,各个传感器通过改进的单一数据流频繁项集挖掘算法找出本地的局部频繁项集,并逐层上传、合并,最后由sink节点将所有子节点的局部频繁项集合并成全局的频繁项集,并产生相应的关联规则.实验证明该算法占用较少的计算时间和内存.  相似文献   

12.
无线传感器网络中节点密集,分布范围广,长期监测使得信息量巨大,如何从大量的感知数据中提取或"挖掘"有用的知识,就成为无线传感器网络中信息处理的核心问题。本文提出一种新的关联规则挖掘算法PLT-STREAM,用来发现节点之间的有用关联,以此消除节点之间信息的冗余。该算法能帮助用户对数据进行有效的融合、分类、查询、分析、理解和决策。实验结果表明,该方法能够有效减少信息处理中通信和计算所消耗的能量,缩短数据查询响应的时间,从而延长整个网络的寿命。  相似文献   

13.
针对有向传感器网络中存在覆盖重叠区和盲区这一问题, 引入重叠质心和有效质心的概念, 提出了一种基于虚拟势场的有向传感器网络覆盖优化算法PCAFD。该算法通过重叠质心和有效质心相互作用, 使节点因受虚拟斥力而改变感知方向, 并针对边界情况和网络优化过程中的节点往复运动现象进行改进。算法快速地提高了网络覆盖率, 一系列仿真验证了该算法的有效性。  相似文献   

14.
无线传感器网络中的节点定位问题因为与很多的实际应用直接相关而尤为受到关注。节点定位机制可以分为基于测距(rang-based)的定位以及与距离无关(rang-free)的定位。文章在分析得出基于测距的定位算法实用性较差的基础上,着重研究了与距离无关的定位改进,对典型的质心算法进行了扩展,并通过实验给出了其性能评价。  相似文献   

15.
考虑实际无线传感网系统中数据传输时延和跳数受限情况,且为降低算法的时间复杂度,提出一种移动无线传感网的Sink节点移动路径选择算法(MPSA)。在MPSA算法中,Sink节点采用分布式最短路径树算法收集k+1跳通信范围内传感节点的相关信息和感知数据,采用虚拟力理论计算边界、障碍物和空洞区域的虚拟斥力、第k+1跳未覆盖传感节点的虚拟引力和所有虚拟力的合力,根据停留次数、合力大小和方向等信息计算当前网格中心的停留时间和下一个停留网格中心。仿真结果表明:MPSA算法根据传感节点的位置、剩余能量等信息,寻找到一条较优的移动路径,从而提高Sink节点的数据收集量和节点覆盖率,降低传感节点的感知数据丢弃量。总之,在数据传输时延和跳数受限下,MPSA算法比RAND算法、GMRE算法和EASR算法更优。  相似文献   

16.
一种用于无线传感器网络的质心定位算法   总被引:4,自引:0,他引:4       下载免费PDF全文
在建立定位算法求解数学模型和定位性能描述的基础上,提出了一种无线传感器网络定位算法——去中心化场强加权多跳质心定位算法。该算法对单跳质心算法进行多跳扩展以改善定位比率,并加入场强加权过程和去中心化过程以提高定位精度。通过仿真实验分析可以看到,与原始质心算法相比,此质心定位算法的平均定位误差可下降一半左右,并使节点密度较低情况下的定位比率提高至接近1。  相似文献   

17.
针对多障碍影响的有向异构传感器网络中的覆盖问题,在满足有向感知模型的基础上,提出了基于虚拟势场的多障碍的有向异构传感器网络覆盖优化算法PCMODH。该算法通过引入重叠质心和有效质心的概念,对多障碍影响的有向异构传感器网络进行邻居节点的虚拟受力优化、节点往复运动优化、边界节点及障碍物节点处理。该算法优化了随机部署产生的覆盖问题,提高了多障碍的有向异构传感器网络的覆盖率。仿真结果证明了该算法的有效性。  相似文献   

18.
基于加权质心和DV-Hop混合算法WSN定位方法研究   总被引:2,自引:0,他引:2  
为了提高无线传感器网络中节点定位的精确度,分析了DV-Hop(distance vector-hop,距离向量-跳段)定位算法和质心算法的优缺点,提出基于加权质心和DV-Hop混合算法,并用MATLAB进行了仿真实验.实验结果表明,在基准节点密度相同的条件下,混合算法的定位精度比DV-Hop平均提高了20%,比质心算法平均提高了15%.该混合算法在提高无线传感器节点精确度上是有效的.  相似文献   

19.
社区发现算法对分析复杂网络的拓扑和层次结构、预测复杂网络的演化趋势等具有十分重要的意义.传统的社区发现算法划分精度不高,忽略了网络嵌入的重要性.针对这样的问题,提出了基于节点相似性和网络嵌入Node2Vec方法的无参数社区发现算法.首先,使用网络嵌入Node2Vec方法将网络节点映射成欧氏空间中低维向量表示的数据点,计...  相似文献   

20.
本文针对三维无线传感器网络中APIT定位算法覆盖效率低的问题,提出一种基于质心迭代的三维APIT定位算法(TC-APIT)。该算法对包含未知节点的四面体进行质心迭代求解,减少了网格扫描法的计算量。同时该算法将已经定位的未知节点晋升为锚节点,对网络中的稀疏节点进行重新定位。仿真结果表明:改进后的算法相比于原有APIT定位算法,实现了稀疏节点定位,覆盖率增大12%左右。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号