首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
由于专家能够对土地资源标定类别的数量是非常有限的,提出利用少量已知类别的训练样本抽取其中的关联规则作为监督信息,结合非监督方法中的变色龙算法,以互连性和相似度作为评价标准进行分类的方法。该算法充分利用监督学习分类准确率高和非监督学习无需标定学习样本的优点,只需利用少量带标签的学习样本,即可得到较高的分类准确率。通过对广东省土地资源的评价实验,表明仅随机选取300组训练样本即可得到较高的土地评价准确率94.418 4%,比同样条件下聚类分析的准确率高4.904 1%。  相似文献   

2.
图像聚类通过表征学习对图像数据降维并提取有效特征而后进行聚类分析。当图像数据存在超多类别时,数据分布的复杂性和类簇的密集性严重影响了现有方法的实用性。为此,提出了基于对比学习的超多类深度图像聚类模型,主要分为3个阶段:首先,改进对比学习方法训练特征模型以使类簇分布均匀;其次,基于语义相似性原则多视角挖掘实例语义最近邻信息;最后,将实例及其最近邻作为自监督信息训练聚类模型。根据实验类型的不同,设计了消融实验和对比实验。在消融实验中,证明了所提方法使类簇均匀分布在映射空间,并可靠挖掘语义最近邻信息。在对比实验中,将其与先进算法在7个基准数据集上进行了比较,在ImageNet-200类数据集上,其准确率比目前先进方法提升了10.6%;在ImageNet-1000类数据集上,其准确率比目前先进算法提升了9.2%。  相似文献   

3.
基于多示例的K-means聚类学习算法   总被引:1,自引:1,他引:0       下载免费PDF全文
谢红薇  李晓亮 《计算机工程》2009,35(22):179-181
多示例学习是继监督学习、非监督学习、强化学习后的又一机器学习框架。将多示例学习和非监督学习结合起来,在传统非监督聚类算法K-means的基础上提出MIK-means算法,该算法利用混合Hausdorff距离作为相似测度来实现数据聚类。实验表明,该方法能够有效揭示多示例数据集的内在结构,与K-means算法相比具有更好的聚类效果。  相似文献   

4.
基于EM算法的文本聚类优化研究   总被引:1,自引:0,他引:1  
针对现有的文本聚类算法难以取得满意结果的问题,以EM算法为基础,提出能分别描述相似、不相似聚类对的相似性分布以及重要、不重要文档的重要性分布的文本聚类优化模型(text clustering optimization model, TCOM).基于该模型,设计一种通过合并不同的文本聚类结果以获取最优性能的方法.实验结果表明,利用该方法同时改善了聚类精度和召回率,其性能优于单独使用现有的硬、软聚类算法.  相似文献   

5.
针对现有的主动学习算法在多分类器应用中存在准确率低、速度慢等问题,将基于仿射传播(AP)聚类的主动学习算法引入到多分类支持向量机中,每次迭代主动选择最有利于改善多类SVM分类器性能的N个新样本点添加到训练样本点中进行学习,使得在花费较小标注代价情况下,能够获得较高的分类性能。在多个不同数据集上的实验结果表明,新方法能够有效地减少分类器训练时所需的人工标注样本点的数量,并获得较高的准确率和较好的鲁棒性。  相似文献   

6.
一种半监督K均值多关系数据聚类算法   总被引:3,自引:1,他引:3  
提出了一种半监督K均值多关系数据聚类算法.该算法在K均值聚类算法的基础上扩展了其初始类簇的选择方法和对象相似性度量方法,以用于多关系数据的半监督学习.为了获取高性能,该算法在聚类过程中充分利用了标记数据、对象属性及各种关系信息.多关系数据库Movie上的实验结果验证了该算法的有效性.  相似文献   

7.
现实世界包含复杂的图数据,其节点之间通常包含多种关系,这种图被称为多关系属性图。图聚类是挖掘图数据相似信息的技术之一,然而现有的图聚类的方法大多只适用于单关系图。即使有的方法考虑到了多关系图,也往往是将图表示学习与聚类看作两个单独的过程。受Deep Graph Infomax(DGI)算法的启发,文中设计了一种基于对比学习的多关系属性图的聚类方法(CCLMAG),用于解决上述问题:1)通过引入社区级互信息机制,弥补了DGI算法无法融合簇信息的缺点;2)引入嵌入融合模块来聚合不同关系上的节点嵌入;3)引入聚类优化模块将图表示学习与聚类两个过程联系起来,使得学习到的节点表示更适合聚类任务。在3个公开数据集和1个构建的期货数据集上的大量实验表明,所提方法优于目前最先进的基线方法,且具有实际应用价值。  相似文献   

8.
在传统的联邦学习中,多个客户端的本地模型由其隐私数据独立训练,中心服务器通过聚合本地模型生成共享的全局模型。然而,由于非独立同分布(Non-IID)数据等统计异质性,一个全局模型往往无法适应每个客户端。为了解决这个问题,本文提出一种针对Non-IID数据的基于AP聚类算法的联邦学习聚合算法(APFL)。在APFL中,服务器会根据客户端的数据特征,计算出每个客户端之间的相似度矩阵,再利用AP聚类算法对客户端划分不同的集群,构建多中心框架,为每个客户端计算出适合的个性化模型权重。将本文算法在FMINST数据集和CIFAR10数据集上进行实验,与传统联邦学习FedAvg相比,APFL在FMNIST数据集上提升了1.88个百分点,在CIFAR10数据集上提升了6.08个百分点。实验结果表明,本文所提出的APFL在Non-IID数据上可以提高联邦学习的精度性能。  相似文献   

9.
高效的Web图像检索对于用户来说是非常重要的,图像元搜索引擎作为一种有效的图像检索技术可以促进Web图像的检索质量和精度.提出一种基于改进的HACM(hierarchical agglomerative clustering methods)聚类算法和遗传算法的图像元搜索引擎模型,Web图像向量化表示之后运用HACM聚类技术进行分类,然后通过特殊设计的遗传算法对检索结果进行优化排序,最后将排序后的更精确的图像集提供给用户.实验结果表明,该系统可以在较短的时间内达到很高的检索精度.  相似文献   

10.
传统的聚类图像分割方法一般仅仅利用图像中的灰度信息。为了更好地利用图像中的区域和边缘信息,提出一种基于分水岭过分割的多目标模糊核聚类图像分割算法。该算法采用分水岭算法获得图像的过分割区域,采用多目标模糊核聚类算法对区域代表点和分水岭上的像素进行聚类。根据聚类结果将图像中的像素进行标记,得到最终的分割图像。实验结果表明,由于利用了图像区域信息,使得目标能够比较完整地从背景中分离出来。  相似文献   

11.
一种结合多示例学习的图像检索方法   总被引:2,自引:0,他引:2  
提出一种基于多示例学习(Multiple—instance learning)的图像检索方法,将多示例学习应用于图像检索中,以有效的处理图像的歧义性。该方法首先将图像作为多示例包,其次采用自适应k—means图像分割算法将图像自动分成多个示例,然后根据用户选择的实例图像生成正包和反包,再采用EM—DD(expectation maximization diversedensity)算法进行多示例学习,实现图像检索和相关反馈,最终使用户得到比较满意的结果。  相似文献   

12.
针对卷积神经网络应用于图像分类任务时需要大量有标签数据的问题,提出一种融合卷积神经网络和聚类分析的无监督分类模型,将无监督算法引入深度学习,并将该模型应用到图像分类领域,来弥补现有分类方式的不足.首先对经典卷积神经网络AlexNet从网络结构和模型训练两个方面进行优化;然后利用改进后的自适应快速峰值聚类算法指导聚类过程...  相似文献   

13.
为提高编译器的自适应性,以应对复杂的体系结构,提出一个结合迭代编译和机器学习的编译框架。编译器可将在优化空间中搜索到的最佳编译选项信息保存到知识库中,并能从知识库中学习获得适合当前程序的最佳编译选项。实例学习算法具有增量式的特点,可有效利用编译过程中积累的数据。通过避免冗余实例入库以及从库中剔除噪声实例,保证学习的精度与效率。  相似文献   

14.
基于学习聚类的图像语义检索算法   总被引:1,自引:0,他引:1       下载免费PDF全文
本文利用聚类理论提出了一种基于学习的聚类图像语义检索算法,建立了底层特征和高层语义的映射,实现了语义的快速提取和图像的精确检索。它由聚类构造算法、聚类构造学习和图象检索算法组成。实验结果表明,本算法是比较稳定和有效的。  相似文献   

15.
多示例学习已经广泛地应用到各个领域,如图像检索、文本分类、人脸识别等.而近年来深度神经网络也成功地运用到各个任务和问题上,MI-Nets是深度神经网络在多示例学习领域一个成功的应用.虽然MI-Nets很成功,但其主要在图像相关的任务上表现突出,而在非图像任务比如文本分类任务上的性能并不令人满意.而最近2年兴起的深度森林在非图像任务上取得了较好的成绩,并因为其相对于深度神经网络有较少的参数和较稳定的性能而受到青睐.所以用深度森林来提升多示例学习性能具有可行性.但由于深度森林结构的限制,并不能把组成深度森林的每一个森林都直接替换成包级别的森林,需要修改深度森林的结构来达到目的.提出了一种新的深度森林架构MIDF.在该架构下,为了使得中间层的输出分布可以和包中的示例拼接成功,拼接时把包里的每个示例都看作是一个包,从而使得级联结构依然有效.另外,还能自动确认深度森林的层数.实验结果表明:该方法在图像任务上的性能与擅长处理图像任务的MI-Nets相当;而在文本数据上,该方法取得了比MI-Nets和其他基线算法更好的效果.  相似文献   

16.
Interval Set Clustering of Web Users with Rough K-Means   总被引:1,自引:0,他引:1  
Data collection and analysis in web mining faces certain unique challenges. Due to a variety of reasons inherent in web browsing and web logging, the likelihood of bad or incomplete data is higher than conventional applications. The analytical techniques in web mining need to accommodate such data. Fuzzy and rough sets provide the ability to deal with incomplete and approximate information. Fuzzy set theory has been shown to be useful in three important aspects of web and data mining, namely clustering, association, and sequential analysis. There is increasing interest in research on clustering based on rough set theory. Clustering is an important part of web mining that involves finding natural groupings of web resources or web users. Researchers have pointed out some important differences between clustering in conventional applications and clustering in web mining. For example, the clusters and associations in web mining do not necessarily have crisp boundaries. As a result, researchers have studied the possibility of using fuzzy sets in web mining clustering applications. Recent attempts have used genetic algorithms based on rough set theory for clustering. However, the genetic algorithms based clustering may not be able to handle the large amount of data typical in a web mining application. This paper proposes a variation of the K-means clustering algorithm based on properties of rough sets. The proposed algorithm represents clusters as interval or rough sets. The paper also describes the design of an experiment including data collection and the clustering process. The experiment is used to create interval set representations of clusters of web visitors.  相似文献   

17.
通过融合图像中不同模态的信息并利用少量带标记的图像进行半监督距离学习,来对图像进行聚类。首先,提取彩色图像中RGB颜色空间的直方图信息、纹理信息,并采用SIFT算法提取Bag of Words来重新表达图像,从而基于图像的颜色特征、纹理特征以及语义特征,建立图像的多模态表达机制,将原始图像投射到表达空间;然后,利用少量标记的图像,通过半监督距离学习,获得图像在多模态信息空间的相似性度量;最后,通过半监督聚类方法,实现图像分组,在多个图像数据库中验证提出的方法的有效性。  相似文献   

18.
针对图像去噪过程中会导致细节和纹理结构信息丢失的不足,本文提出了基于字典学习和原子聚类的图像去噪算法。该算法首先利用含噪图像通过字典学习算法得到自适应的冗余字典,然后提取字典中每个原子的HOG特征和灰度统计特征构成特征集,并利用原子的特征集将冗余字典中的原子分成两类(不含噪原子和噪声原子),最后利用不含噪原子恢复图像,达到去噪的目的。实验结果表明,本文提出的算法无需知道噪声的先验信息,峰值信噪比好于现有的流行算法,且能较好地保持图像细节和纹理结构信息,提高了视觉效果。  相似文献   

19.
郭小卫  官小平 《遥感信息》2006,(6):20-22,54
提出了一种多尺度无监督遥感图像分割方法。通过对多尺度图像数据在每个尺度上进行Gauss子集聚类,并将每个像素的邻域内的Gauss子集类别标记作为特征向量,利用Markov四叉树模型进行二次聚类,从而实现无监督图像分割。与其他基于多尺度Markov模型的无监督分割方法和传统动态聚类方法相比,该方法既无需假定每类的分布形式,又能较好地反映数据的概率结构。合成图像与SAR图像的实验结果表明,该方法的分割精度接近于有监督的H-MPM和H-SMAP方法。  相似文献   

20.
本体构造就是利用各种数据源以半自动方式新建或扩充改编已有本体以构建一个新本体。现有的本体构造方法大都以大量领域文本和背景语料库为基础抽取大量概念术语,然后从中选出领域概念构造出一个本体。Cluster-Merge算法首先对领域文档先用k-means聚类算法进行聚类,然后根据文档聚类的结果来构造本体,最后根据本体相似度进行本体合并得到最终的输出本体。通过实验可证明用Cluster-Merge算法得出的本体可以提高查全率、查准率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号