首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 62 毫秒
1.
采取了3种必要的措施提高了聚类质量:考虑到各维数据特征属性对聚类效果影响不同,采用了基于统计方法的维度加权的方法进行特征选择;对于和声搜索算法的调音概率进行了改进,将改进的和声搜索算法和模糊聚类相结合用于快速寻找最优的聚类中心;循环测试各种中心数情况下的聚类质量以获得最佳的类中心数。该算法被应用于并行计算性能分析中,用于识别并行程序运行时各处理器运行性能瓶颈的类别。实验结果表明该算法较其他算法更优,这样的性能分析方法可以提高并行程序的运行效率。  相似文献   

2.
3.
半监督聚类是机器学习的重要研究内容之一,它通过利用样本层面的少量标记数据信息或者利用特征层面的特征偏好信息来指导半监督聚类。但现有的半监督聚类算法仅考虑了单一层面的半监督先验信息,罕有同时考虑两个不同层面的此类信息进行半监督聚类。为了弥补这一遗漏,联合利用特征层面给定的特征偏好,即特征之间的相对重要性关系,并结合样本层面的少量标记数据等半监督信息,在传统的半监督聚类算法基础上发展出一个扩展型半监督聚类算法。初步实验验证了该算法的有效性。  相似文献   

4.
一种基于谱聚类的半监督聚类方法   总被引:6,自引:1,他引:6  
司文武  钱沄涛 《计算机应用》2005,25(6):1347-1349
半监督聚类利用少部分标签的数据辅助大量未标签的数据进行非监督的学习,从而提高聚类的性能。提出一种基于谱聚类的半监督聚类算法,其利用标签数据的信息,调整点与点之间的距离所形成的距离矩阵,而后基于被调整的距离矩阵进行谱聚类。实验表明,该算法较之于已提出的半监督聚类算法,获得了更好的聚类性能。  相似文献   

5.
针对文本信息特征冗余多、噪声大问题,提出基于和声搜索机制的文本特征选择算法.以词频逆文本频率指数为目标函数评估特征词条;在初始文档集中通过和声搜索的记忆考虑、纵向倾角调整和随机选择3种特征选择新解更新规则,迭代搜索最优特征子集;以最优特征子集为基础,以K均值进行文本聚类.利用4种典型文档数据集进行仿真实验,实验结果表明...  相似文献   

6.
数据集的聚类边界不清晰时,人工免疫网络聚类使用最小生成树确定聚类数的依据往往不足.分析了问题存在的原因,提出一种基于人工免疫网络的半监督聚类算法.该算法一方面在抗体克隆操作中嵌入数据集 的先验信息,抑制位于聚类边界区域抗体的激活能力,从而保证记忆网络能更清晰的反映数据集中各聚类原型的结构;另一方面,将先验信息用于...  相似文献   

7.
半监督聚类算法研究现状   总被引:1,自引:0,他引:1  
半监督聚类是近几年机器学习领域的一个新的研究方向,也是数据挖掘的一个重要分支,逐步成为许多领域的有用工具。对数据挖掘半监督聚类算法的研究现状及发展趋势进行了分析与概括,并比较分析几种典型半监督聚类算法的优点与局限性,以便于对半监督聚类算法作进一步的研究。  相似文献   

8.
崔鹏  张汝波 《计算机科学》2010,37(7):205-207
半监督聚类是近年来研究的热点,传统的方法是在无监督算法的基础上加入有限的背景知识来提高聚类性能.然而大多数半监督聚类技术都基于邻近或密度,难以处理高维数据,因此必须将约减的特征加入到半监督聚类过程中.为解决此问题,提出了一种新的半监督聚类算法框架.该算法利用样本约束传递性进行预处理,然后将特征投影到低维空间实现降维,最终用半监督算法对约减后的样本进行聚类.通过实验同现行主要降维方法进行了比较,说明此方法能有效地处理高维数据,聚类效果良好.  相似文献   

9.
高维数据中许多特征之间互不相关或冗余,这给传统的学习算法带来了巨大的挑战。为了解决该问题,特征选择应运而生。与此同时,许多实际问题中数据存在多个视图而且数据的标签难以获取,多视图学习和半监督学习成为机器学习中的热点问题。本文研究怎样从"部分标签"的多视图数据中选择最大相关最小冗余的特征子集,提出一种基于多视图的半监督特征选择方法。为了剔除冗余和无关的特征,探索蕴含于多视图数据中的互补信息以及每个视图中不同特征之间的冗余关系,并利用少量标签数据蕴含的信息协同未标签数据同时进行特征选择。实验结果验证了本算法能够获得很好的特征选择效果及聚类效果。  相似文献   

10.
半监督的仿射传播聚类   总被引:4,自引:0,他引:4       下载免费PDF全文
仿射传播聚类算法快速、有效,可以解决大数据集的聚类问题,但当数据的聚类结构比较松散时,聚类准确性不高。该文提出了半监督的仿射传播聚类算法,在迭代过程中嵌入了有效性指标以监督和引导算法向最优聚类结果的方向运行。实验结果表明,该方法对于聚类结构比较紧密和松散的数据集,均可以给出较为准确的聚类结果。  相似文献   

11.
Microarray technology can be used as an efficient diagnostic system to recognise diseases such as tumours or to discriminate between different types of cancers in normal tissues. This technology has received increasing attention from the bioinformatics community because of its potential in designing powerful decision-making tools for cancer diagnosis. However, the presence of thousands or tens of thousands of genes affects the predictive accuracy of this technology from the perspective of classification. Thus, a key issue in microarray data is identifying or selecting the smallest possible set of genes from the input data that can achieve good predictive accuracy for classification. In this work, we propose a two-stage selection algorithm for gene selection problems in microarray data-sets called the symmetrical uncertainty filter and harmony search algorithm wrapper (SU-HSA). Experimental results show that the SU-HSA is better than HSA in isolation for all data-sets in terms of the accuracy and achieves a lower number of genes on 6 out of 10 instances. Furthermore, the comparison with state-of-the-art methods shows that our proposed approach is able to obtain 5 (out of 10) new best results in terms of the number of selected genes and competitive results in terms of the classification accuracy.  相似文献   

12.
Feature selection is an important method of data preprocessing in data mining. In this paper, a novel feature selection method based on multi-fractal dimension and harmony search algorithm is proposed. Multi-fractal dimension is adopted as the evaluation criterion of feature subset, which can determine the number of selected features. An improved harmony search algorithm is used as the search strategy to improve the efficiency of feature selection. The performance of the proposed method is compared with that of other feature selection algorithms on UCI data-sets. Besides, the proposed method is also used to predict the daily average concentration of PM2.5 in China. Experimental results show that the proposed method can obtain competitive results in terms of both prediction accuracy and the number of selected features.  相似文献   

13.
异构Map-Reduce环境中资源分配策略直接影响其响应时间,如何利用有效的策略将计算任务分配到计算资源是亟待解决的问题。利用和声搜索算法对异构Hadoop集群中的计算资源分配问题进行优化。对问题进行建模时考虑了异构计算机集群中各节点的处理能力、带宽和线路质量和源数据位置等因素对计算资源分配的影响,利用和声搜索算法优化资源分配策略,以期在满足用户需求的前提下提高系统的响应时间。并用Gridsim对算法进行仿真实验,实验结果表明利用和声搜索算法可以达到减少系统响应时间的目的。  相似文献   

14.
针对现有和声搜索算法存在的不足,提出一种学习型和声搜索算法(LHS).根据目标函数值的变化,自适应调整和声记忆考虑概率(HMCR);引入学习机制,加快算法的搜索速度;动态调节基音调整概率(PAR),增强算法的全局搜索能力.对16个标准函数的测试结果表明,所提出的LHS算法与其他4种和声搜索算法相比具有较好的效果.最后将改进算法应用于10个0-1背包问题和1个经典的50维背包实例,实验结果表明LHS算法优于其他算法.关键词:和声搜索算法;自适应;学习策略;搜索速度;0-1背包问题  相似文献   

15.
结合和声搜索和变邻域搜索算法的特点,提出混合的和声变邻域搜索算法,并将混合算法用于解决多处理机独立任务调度问题.混合算法采用列表调度方法对和声解进行编码,把和声分量转换为基于优先级的独立任务调度模型,利用变邻域搜索算法对和声解进行局部搜索以提高和声算法的搜索效率和解质量,利用模拟退火算法中的Metropolis准则作为新解接受准则,防止算法陷入局部极值.仿真实验对比结果表明,混合算法在解决独立任务的多处理机调度中具有更强的全局搜索能力和更快的收敛速度,并且能够跳出局部极小获得更高质量的解.  相似文献   

16.
针对于求解一般的整数规划问题,提出了和声蚁群耦合算法。采用和声搜索更新种群策略和个体扰动策略改善了蚁群算法过早收敛的问题,同时采用蚁群算法对寻优路径信息素的正反馈来加快和声搜索收敛于最优路径。实验结果表明,相比于蚁群算法和和声搜索算法,新算法大大提高了一般整数规划问题的搜索效率。  相似文献   

17.
自适应和声搜索算法及在粗糙集属性约简中的应用   总被引:1,自引:0,他引:1  
针对改进和声搜索算法(IHS)存在的不足,提出了自适应和声搜索算法(AHS).该算法利用和声库中变量函数的最大差值来调节PAR 和bw,从而提高了对多维问题的搜索效率.利用5个标准测试函数对AHS算法进行测试,并应用于粗糙集的属性约简中.仿真结果表明了该算法的有效性和实用性.  相似文献   

18.
和声搜索算法探索能力研究及其修正   总被引:1,自引:0,他引:1  
和声搜索算法(harmony search,HS)的一大缺点是它容易陷入局部最优.针对此缺点,深入研究了近期文献中所提出的步长(bw)调整方法.首先具体分析了和声搜索算法即兴创作过程的探索能力,而后推导出在不对称区间下即兴创作过程的探索能力与各参数的关系,并进一步讨论了bw对探索能力和算法收敛的影响,证明了方差期望和均值期望所组成的迭代方程的迭代收敛充分性.基于这些分析和证明,提出一种修正和声搜索算法(modified harmony search,MHS),并分析了参数和声记忆库大小(harmony memory size,HMS)、基音调整概率(pitch adjusting rate,PAR)及和声记忆库的考虑概率(harmony memory considering rate,HMCR)对MHS优化性能的影响.数值仿真结果表明MHS算法优于HS及最新文献所报道的8种改进HS算法,具有良好的优化性能.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号