首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
本体构造就是利用各种数据源以半自动方式新建或扩充改编已有本体以构建一个新本体。现有的本体构造方法大都以大量领域文本和背景语料库为基础抽取大量概念术语,然后从中选出领域概念构造出一个本体。Cluster-Merge算法首先对领域文档先用k-means聚类算法进行聚类,然后根据文档聚类的结果来构造本体,最后根据本体相似度进行本体合并得到最终的输出本体。通过实验可证明用Cluster-Merge算法得出的本体可以提高查全率、查准率。  相似文献   

2.
基于k-means聚类算法的研究   总被引:4,自引:0,他引:4  
分析研究聚类分析方法,对多种聚类分析算法进行分析比较,讨论各自的优点和不足,同时针对原k-means算法的聚类结果受随机选取初始聚类中心的影响较大的缺点,提出一种改进算法.通过将对数据集的多次采样,选取最终较优的初始聚类中心,使得改进后的算法受初始聚类中心选择的影响度大大降低;同时,在选取初始聚类中心后,对初值进行数据标准化处理,使聚类效果进一步提高.通过UCI数据集上的数据对新算法Hk-means进行检测,结果显示Hk-means算法比原始的k-means算法在聚类效果上有显著的提高,并对相关领域有借鉴意义.  相似文献   

3.
针对k-means聚类算法效率底、优化不足等问题,提出了一种基于变异的迭代k-meaus算法(ik-means)。该算法从k-means算法(随机k-means算法)所产生的初始解向量中随机选取一定比例的位置,对其中的类标号进行随机变异并优化;再通过多次迭代获得了相应的优化解。实验表明在数据集相同、基本k—means算法调用次数相同的条件下,ik-means算法相对于k-means算法具有运行效率高、解更优化的特点。  相似文献   

4.
对k-means聚类算法的改进   总被引:17,自引:6,他引:17  
袁方  孟增辉  于戈 《计算机工程与应用》2004,40(36):177-178,232
提出了一种k-means聚类算法中寻找初始聚类中心的新方法。算法首先计算样本间的距离,然后根据样本点之间的距离寻找有可能是一类的数据,依据这些样本点形成初始聚类中心,从而得到较好的聚类结果。实验表明,改进后的方法相对于随机选取初始聚类中心具有较高的准确率。  相似文献   

5.
基于语义Web的本体及本体映射研究概述   总被引:6,自引:0,他引:6  
本体在语义Web中具有重要的地位,是解决语义层次上Web信息共享和交换的基础。文中介绍了本体的基本概念、描述语言及其在语义Web中的应用、本体映射的基本知识并综述了相关本体映射工程中的具体思想和方法。  相似文献   

6.
初始聚类中心优化的k-means算法   总被引:37,自引:0,他引:37       下载免费PDF全文
传统的k-means算法对初始聚类中心敏感,聚类结果随不同的初始输入而波动。为消除这种敏感性,提出一种优化初始聚类中心的方法,此方法计算每个数据对象所在区域的密度,选择相互距离最远的k个处于高密度区域的点作为初始聚类中心。实验表明改进后的k-means算法能产生质量较高的聚类结果,并且消除了对初始输入的敏感性。  相似文献   

7.
传统k-means算法由于初始聚类中心的选择是随机的,因此会使聚类结果不稳定。针对这个问题,提出一种基于离散量改进k-means初始聚类中心选择的算法。算法首先将所有对象作为一个大类,然后不断从对象数目最多的聚类中选择离散量最大与最小的两个对象作为初始聚类中心,再根据最近距离将这个大聚类中的其他对象划分到与之最近的初始聚类中,直到聚类个数等于指定的k值。最后将这k个聚类作为初始聚类应用到k-means算法中。将提出的算法与传统k-means算法、最大最小距离聚类算法应用到多个数据集进行实验。实验结果表明,改进后的k-means算法选取的初始聚类中心唯一,聚类过程的迭代次数也减少了,聚类结果稳定且准确率较高。  相似文献   

8.
王刚  钟国祥 《计算机科学》2010,37(9):222-224
为了改善文本聚类的质量,得到满意的聚类结果,针对文本聚类缺少涉及概念的内涵及概念间的联系,提出了一种基于本体相似度计算的文本聚类算法TCBO(Text Clustering Based on Ontology).该算法把文档用本体来刻画,以便描述概念的内涵及概念间的联系.设计和改进了文本相似度计算算法,应用本体的语义相似度来度量文档间相近程度,设计了具体的根据相似度进行文本聚类的算法.实验证明,该方法从聚类的准确性和聚类的关联度方面改善了聚类质量.  相似文献   

9.
胡鹤  刘大有  胡志永 《计算机工程》2005,31(10):139-141
时间和空间的表示和推理是人工智能研究中重要的组成部分。随着时空信息在地理信息系统、时空数据库、CAD/CAM等领域的重要应用,时空信息的本体表示越来越受到人们的重视。目前时空本体的构造都是基于一阶谓词逻辑,不能直接应用最新的OWL本体语言描述,不利于其在语义Web上的表示和应用。为解决这一问题,该文研究了使用一阶谓词逻辑到描述逻辑的逻辑映射构造的时空本体,给出了基于Web本体语言OWL的时空本体在Protégé环境中的具体实现。  相似文献   

10.
基于OWL的本体建模研究   总被引:1,自引:0,他引:1  
计算机对语义Web上的文档理解是建立在本体基础之上的,本体是用来定义概念和数据之间的关系的,因此本体建模是非常重要的。介绍了本体与语义Web的关系,并以基于OWL的本体为例,对本体的建模以及相关问题进行研究。  相似文献   

11.
12.
本体在语义Web中具有重要的地位,是解决语义层次上Web信息共享和交换的基础.文中介绍了本体的基本概念、描述语言及其在语义Web中的应用、本体映射的基本知识并综述了相关本体映射工程中的具体思想和方法.  相似文献   

13.
《软件工程师》2019,(5):32-34
针对传统k-means算法中初始聚类中心随机确定的问题,提出k-means改进算法。首先,定义变量权值,权值的大小等于样本密度乘以簇间距离除以簇内样本平均距离,通过最大权值来确定聚类中心,克服了随机确定聚类中心的不稳定性。然后在Hadoop平台上用Map-Reduce框架下实现算法的并行化。最后以南通公交IC刷卡记录为例,通过改进的k-means聚类算法进行IC卡刷卡记录的分析。实验表明,在Hadoop平台下改进k-means算法运行稳定、可靠,具有很好的聚类效果。  相似文献   

14.
经典的k-means聚类简单,快速,能够有效地处理大数据量.将k-means聚类引入到海洋信息处理中,提出基于k-means聚类的水团划分算法KWMD.KWMD算法根据样本数据中的三维空间信息和物理海洋信息,实现了快速、高效的水团划分,并以三维交互方式表现水团划分结果.通过对黄海、东海比邻海区海洋信息数据的水团划分处理,实验结果表明算法是正确和有效的.  相似文献   

15.
张宜浩  金澎  孙锐 《计算机应用》2012,32(5):1332-1334
汉语中一词多义现象普遍存在,词义归纳就是对在不同语境中具有相同语义的词进行归类,本质上是一聚类问题。目前广泛采用无指导的聚类方法对词义归纳进行研究,提出一种改进的k-means算法,该算法主要从初始簇中心的选取以及簇均值的计算两个方面进行改进,在一定程度上克服了其对“噪声”和孤立点数据的敏感。在特征表示上用同义词词林中词的分类编号来降低特征维度。实验表明改进k-means算法在性能上有较大的提升,F-Score达到了75.8%。  相似文献   

16.
语义Web与本体的关系极为特殊,本体在语义Web本身的体系结构中扮演着极为重要的角色,同时,位于语义Web体系结构的其它层的XML、RDF(S)等与本体也有着千丝万缕的联系。为阐述两者的关系,探讨基于本体的语义Web的特点及应用,介绍了本体和语义Web的产生和发展,在此基础上对基于本体的语义Web进行研究,重点分析了本体在描述语义方面弥补了XML、RDF(S)等的不足,并结合Web服务检索的实例介绍了本体在Web服务上的应用。  相似文献   

17.
映射效率对于Web服务发现和组合、智能空间上下文感知等领域的动态映射至关重要。现有方法对相似度计算方法加以简化来提升效率,但当候选匹配实体对的数目随本体的规模增大而急剧增加时,就无法有效地处理。文中提出一种基于本体分割的高效本体映射算法。通过自下而上的聚类,将本体划分为一组大小合适的本体块。然后基于向量空间算法进行块映射,并从块映射结果中选取实体映射的候选匹配对,从而削减其数量,达到减少时间复杂度的目的。实验表明,文中方法显著提升运行时本体映射的效率,比Falcon-AO本体映射方法快6倍。  相似文献   

18.
基于关系数据库的OWL本体构建方法的研究   总被引:3,自引:0,他引:3  
利用已有的数据资源以自动或半自动方式构建本体是实现语义Web的任务之一.在分析了现有研究成果及不足的基础上,给出了一个比较系统的基于关系数据库的OWL本体构建方法.介绍了如何从关系模式中识别实体、联系、继承关系、聚类关系及基数约束等语义,完成了从关系数据库语义到本体相应部分的转换,通过原型系统的实现验证了该方法的有效性.  相似文献   

19.
利用Web资源完成本体构造方法的研究。不仅会缩短本体的构造周期,而且还会扩大本体的应用范围.但由于基于Web的数据提取、知识获取比较困难,与实际应用相比还有一定的距离.该文分析了基于Web本体构造数据源的动态、海量、异质、变化、开放性等特点,本体构造的基础问题——形式化表示方法,总结了本体构造的关键技术及技术难点.初步设计了一个系统结构,为实现基于Web领域本体构造方法提供了一个框架性的思路.  相似文献   

20.
Web用户聚类是通过分析用户会话,将具有相同或相似访问特征的用户聚为一类。在会话相似性度量方面综合考虑了网页浏览时间和访问频次两个因素,并考虑到用户个人习惯、能力等因素对浏览时间的影响,将浏览时间处理为RDP(Reduce the Differences in Personality)浏览时间,以降低其个性特征。为此,提出一种基于用户特性的RDPk-means聚类算法。实验表明,该算法可以有效实现用户会话的聚类,聚类结果客观合理。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号