首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 75 毫秒
1.
《现代电子技术》2019,(7):162-166
传统K-medoids聚类算法随机选取初始聚类中心,存在迭代次数增加、聚类结果波动较大的问题,因此提出基于全覆盖粒计算的K-medoids文本聚类算法。该算法定义了全覆盖平均粒度重要性的概念。首先对文本进行Single-Pass粗聚类,利用全覆盖粒度重要性和平均粒度重要性从粗聚类结果中产生初始聚类中心候选集,再基于密度和最大最小距离法则从候选集中选出初始聚类中心。通过实验验证,该算法的聚类迭代次数明显减小,聚类质量明显提高。  相似文献   

2.
朴素贝叶斯分类算法由于其计算高效在生活中应用广泛。本文根据集成算法的差异性特征,聚类算法聚类点的选择方式的可变性,提出了基于K-medoids聚类技术的贝叶斯集成算法,朴素贝叶斯的泛化性能得到了提升。首先,通过样本集训练出多个朴素贝叶斯基分类器模型;然后,为了增大基分类器之间的差异性,利用K-medoids算法对基分类器在验证集上的预测结果进行聚类;最后,从每个聚类簇中选择泛化性能最佳的基分类器进行集成学习,最终结果由简单投票法得出。将该算法应用于UCI数据集,并与其他类似算法进行比较可得,本文提出的基于K-medoids聚类的贝叶斯集成算法(NBKME)提高了数据集的分类准确率。  相似文献   

3.
在大规模分布式网络应用中,对网络节点进行聚类是构建高效网络体系结构的有效办法之一.在利用网络坐标系统Vivaldi得到各个节点的网络坐标的基础上,对网络节点进行K-medoids聚类.然后,针对K-medoids算法对初始中心选值敏感和易陷入局部极值的问题,提出基于免疫克隆算法的K-medoids聚类.实验结果表明,该聚类算法具有良好的可靠性及可扩展性,能对节点进行有效聚类.  相似文献   

4.
为了弥补K-medoids算法容易引起收敛过程产生局部极小值问题,结合全覆盖粒度方面考虑,设计了一种基于全覆盖粒度K-medoids算法的文本聚类及其综合性能综合评估方法。以全覆盖粒计算作为参考依据,先计算出各文档特征词权重占比。通过Single Pass聚类算法完成样本集的聚类计算,获得粒度重要度指标,对剩余样本进行重新分配获得最近聚类中心,最终确保各对象与类簇中心距离达到一个稳定值。研究结果表明:全覆盖粒方法构建的K-medoids聚类算法可以实现聚类精度的显著提升。  相似文献   

5.
K-medoids算法作为数据挖掘中重要的一种聚类算法,与差分隐私保护的结合有助于信息数据的安全,原有的基于差分隐私保护的K-medoids聚类算法在初始中心点的选择上仍然具有盲目性和随机性,在一定程度上降低了聚类效果。本文针对这一问题提出一种基于密度权重的优化差分隐私K-medoids(DWDPK-medoids)聚类算法,通过引入数据密度权重知识,确定算法的初始中心点和聚类数,以提高聚类效果和稳定性。安全性分析表明,算法满足ε-差分隐私保护;通过对UCI真实数据集的仿真实验表明,相同隐私预算下该算法比DPK-medoids具有更好的聚类效果和稳定性。  相似文献   

6.
为实现不同条件下年轮髓心的自动定位,本文提出一种基于梯度Hough变换和K-medoids算法的年轮髓心定位算法。首先应对年轮图片进行预处理,将彩色图片灰度化,并进行降噪、图像分割。然后通过Sobel算子提取边缘,利用基于梯度变换的Hough变换计算得到若干疑似髓心。最后利用K-medoids算法对疑似髓心进行聚类,得到最终的髓心。实验结果表明,该算法定位的髓心与人工标定的髓心重合度较高,具有一定的实用性。  相似文献   

7.
《现代电子技术》2019,(23):110-114
研究基于K-medoids聚类的层次化教学质量提升评估方法。通过K-medoids聚类分析数据样本间的最优路径和聚类中心,获取数据样本集的历史最优位置,将历史最优位置点看成不同评估指标;以教学队伍、教学内容、教学条件等两级教学质量评估指标体系作为评估指标构建教学质量评估指标体系;采用多层次评价模型对历史最优位置点,即评估指标实行层次分析,通过分层综合评估过程先对评估指标实施一级评估,确定各评估指标权重,依据权重构建教学质量效果判断矩阵;再采用判断矩阵完成二级评估,评估层次化教学质量。实验结果表明,该方法评估计算机学院教师教学质量为较高,且二班教师教学质量优于一班教学质量。  相似文献   

8.
K-means聚类算法在随机选择的初始聚类中心的基础上进行聚类,其聚类效果会因为初始聚类中心的不确定性而不稳定。为了优化其聚类效果,提出了基于近邻传播算法(AP算法)的K-means聚类优化算法(APK-means)。该算法首先通过近邻传播算法生成若干个初始聚类,然后依序选择k个聚类规模最大的聚类中心作为K-means聚类算法的初始聚类中心,接着运行K-means聚类。算法有效性分析和实验结果验证了该算法有效优化了K-mean算法的聚类稳定性和有效性。  相似文献   

9.
《现代电子技术》2018,(10):164-168
为了解决K-means聚类算法图像分割质量过度依赖于初始聚类中心选取,且易于陷入局部最优解等问题,提出一种基于动态粒子群优化(DPSO)与K-means聚类的图像分割算法(DPSOK)。通过动态调整惯性系数与学习因子来增强PSO算法的性能;然后计算粒子群适应度方差,找准切换至K-means算法时机;随后,将DPSO输出结果用来初始化K-means聚类中心,使其收敛至全局最优解;最后,通过最小化目标函数的多次迭代,使K-means的聚类中心不断更新,直到收敛。实验结果表明,DPSOK能有效提高K-means的全局搜索能力,在图像分割中它比K-means,PSO获得了更好的分割效果,且与粒子群优化和K-means算法相比,DPSOK算法具有更高的分割质量与效率。  相似文献   

10.
针对K-medoids算法中初始聚类中心的结点的选取的随机性导致影响聚类结果质量的问题,采用标签共现原则对该算法进行改进.根据标签共现频率和相似度先对标签进行聚类,根据标签聚类结果,选取K个由其代表的资源作为聚类初始中心结点.通过聚类中心的优化设置,降低了抽样选取的随机性.最后采用MapReduce框架对其进行并行化,以豆瓣图书的标签数据为应用背景进行实验,验证了算法的实用性.  相似文献   

11.
基于VSM的文本聚类忽略了文本关键词稀疏带来的相似度漂移问题和关键词之间的语义信息和各维度之间的关系,致使文本的相似度计算不精确,文中对相似度计算方法TF—IDF进行了改进,并提出一种新的聚类方法,利用分布式估计算法和禁忌搜索算法进行聚类,融合分布式估计算法的收敛速度快和禁忌搜索算法能跳出局部搜索的优点,首先对文本进行预处理,然后用分布式估计算法和禁忌搜索算法聚类,既能快速聚类又能防止聚类收敛到局部最优。测试结果表明这种算法行之有效。  相似文献   

12.
为了满足对XML文档集合进行数据挖掘需求,本文提出了根据XML文档树的语义信息和结构信息来计算其结构相似度,通过结构相似度构造其结构相似度矩阵,在此基础上应用DBSCAN算法来对XML文档集合进行聚类.与其他聚类算法相比,其聚类的速度得到了很大的提高.  相似文献   

13.
为了解决不确定XML数据规范化问题,提出了一种基于粒计算的XML近似多值依赖的判定算法。首先提出集值XML数据模型、集值XML数据库等基本概念;借助相似关系给出XML近似多值依赖的定义;根据等价粒分析如何利用位模式表示集值XML数据库中的信息值,提出路径间存在XML近似多值依赖的判定算法,并对算法的时间复杂性进行了分析。通过实例分析,对于信息值采用位模式,数据格式更接近机器内部表示,算法的运算效率与速度也得到了提高。  相似文献   

14.
个性化服务中用户兴趣聚类算法研究   总被引:2,自引:0,他引:2  
李春妍  王勇 《信息技术》2007,(10):77-80
讨论了个性化服务中用户兴趣建模对聚类算法的要求,指出经典聚类算法应用于用户兴趣聚类时的不足。在基于图论的K近邻聚类算法的基础上进行改进,提出一种基于相似度的聚类算法。实验证明,与K近邻算法相比,该算法能够显著提高聚类质量,有效区分孤立点,适用于用户兴趣聚类。  相似文献   

15.
Cloud computing is the key and frontier field of the current domestic and international computer technology, workflow task scheduling plays an important part of cloud computing, which is a policy that maps tasks to appropriate resources to execute. Effective task scheduling is essential for obtaining high performance in cloud environment. In this paper, we present a workflow task scheduling algorithm based on the resources' fuzzy clustering named FCBWTS. The major objective of scheduling is to minimize makespan of the precedence constrained applications, which can be modeled as a directed acyclic graph. In FCBWTS, the resource characteristics of cloud computing are considered, a group of characteristics, which describe the synthetic performance of processing units in the resource system, are defined in this paper. With these characteristics and the execution time influence of the ready task in the critical path, processing unit network is pretreated by fuzzy clustering method in order to realize the reasonable partition of processor network. Therefore, it largely reduces the cost in deciding which processor to execute the current task. Comparison on performance evaluation using both the case data in the recent literature and randomly generated directed acyclic graphs shows that this algorithm has outperformed the HEFT, DLS algorithms both in makespan and scheduling time consumed. Copyright © 2014 John Wiley & Sons, Ltd.  相似文献   

16.
叶晨  杨振宇  喻剑  龙其 《通信学报》2014,35(12):14-123
提出了一种基于实时路况信息的分布式邻近目标查询算法,采用基于Voronoi图的划分将地理信息存储在离它最近路口的智能摄像头上,实时路况信息由智能摄像头采集,通过对路口的畅通程度进行建模,估算出路口间通行所需要的时间。当有车辆查询邻近目标时,网络中的智能摄像头根据所在路口的畅通程度和到邻近路口的距离,在分布式查询过程中加入延时转发机制,广播目标路径询问的数据分组,使数据分组的发送能模拟当前的路况进行传输,从而获得到达邻近目标的路径。基于真实数据的实验结果表明算法是有效的,处理大量并发查询时的性能优于现有方法。  相似文献   

17.
基于模糊聚类的云任务调度算法   总被引:2,自引:0,他引:2  
为了更好地实践云计算提供廉价按需服务的宗旨,提出了一种在模糊聚类基础上,基于两级调度模式的任务调度(FCTLBS,fuzzy clustering and two level based task scheduling)算法,新算法设置用户调度和任务调度2个等级。对资源进行性能模糊聚类;根据任务参数计算资源偏好,使不同偏好任务在不同聚类中选择,缩小了选择范围,更好地反映了任务需求。仿真实验表明,本算法较之同类算法具备一定的优越性。  相似文献   

18.
One of the most critical issues in using service‐oriented technologies is the combination of services, which has become an important challenge in the present. There are some significant challenges in the service composition, most notable is the quality of service (QoS), which is more challenging due to changing circumstances in dynamic service environments. Also, trust value in the case of selection of more reliable services is another challenge in the service composition. Due to NP‐hard complexity of service composition, many metaheuristic algorithms have been used so far. Therefore, in this paper, the honeybee mating optimization algorithm as one of the powerful metaheuristic algorithms is used for achieving the desired goals. To improve the QoS, inspirations from the mating stages of the honeybee, the interactions between honeybees and queen bee mating and the selection of the new queen from the relevant optimization algorithm have been used. To address the trust challenge, a trust‐based clustering algorithm has also been used. The simulation results using C# language have shown that the proposed method in small scale problem acts better than particle swarm optimization algorithm, genetic algorithm, and discrete gbest‐guided artificial bee colony algorithm. With the clustering and reduction of the search space, the response time is improved; also, more trusted services are selected. The results of the simulation on a large‐scale problem have indicated that the proposed method is exhibited worse performance than the average results of previous works in computation time.  相似文献   

19.
Rule mining was an important research content of data mining,and it was also a hot research topic in the fields of decision support system,artificial intelligence,recommendation system,etc,where attribute reduction and minimal rule set extraction were the key links.Most importantly,the efficiency of extraction was determined by its application.The rough set model and granular computing theory were applied to the decision rule reduction.The decision table was granulated by granulation function,the grain of membership and the concept granular set construction algorithm gener-ated the initial concept granular set.Therefore,attribute reduction could be realized by the distinguish operator of concept granule,and decision rules extraction could be achieved by visualization of concept granule lattice.Experimental result shows that the method is easier to be applied to computer programming and it is more efficient and practical than the existing methods.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号