共查询到20条相似文献,搜索用时 15 毫秒
1.
本体构造就是利用各种数据源以半自动方式新建或扩充改编已有本体以构建一个新本体。现有的本体构造方法大都以大量领域文本和背景语料库为基础抽取大量概念术语,然后从中选出领域概念构造出一个本体。Cluster-Merge算法首先对领域文档先用k-means聚类算法进行聚类,然后根据文档聚类的结果来构造本体,最后根据本体相似度进行本体合并得到最终的输出本体。通过实验可证明用Cluster-Merge算法得出的本体可以提高查全率、查准率。 相似文献
2.
基于k-means聚类算法的研究 总被引:4,自引:0,他引:4
分析研究聚类分析方法,对多种聚类分析算法进行分析比较,讨论各自的优点和不足,同时针对原k-means算法的聚类结果受随机选取初始聚类中心的影响较大的缺点,提出一种改进算法.通过将对数据集的多次采样,选取最终较优的初始聚类中心,使得改进后的算法受初始聚类中心选择的影响度大大降低;同时,在选取初始聚类中心后,对初值进行数据标准化处理,使聚类效果进一步提高.通过UCI数据集上的数据对新算法Hk-means进行检测,结果显示Hk-means算法比原始的k-means算法在聚类效果上有显著的提高,并对相关领域有借鉴意义. 相似文献
3.
针对k-means聚类算法效率底、优化不足等问题,提出了一种基于变异的迭代k-meaus算法(ik-means)。该算法从k-means算法(随机k-means算法)所产生的初始解向量中随机选取一定比例的位置,对其中的类标号进行随机变异并优化;再通过多次迭代获得了相应的优化解。实验表明在数据集相同、基本k—means算法调用次数相同的条件下,ik-means算法相对于k-means算法具有运行效率高、解更优化的特点。 相似文献
4.
对k-means聚类算法的改进 总被引:17,自引:6,他引:17
提出了一种k-means聚类算法中寻找初始聚类中心的新方法。算法首先计算样本间的距离,然后根据样本点之间的距离寻找有可能是一类的数据,依据这些样本点形成初始聚类中心,从而得到较好的聚类结果。实验表明,改进后的方法相对于随机选取初始聚类中心具有较高的准确率。 相似文献
5.
基于语义Web的本体及本体映射研究概述 总被引:6,自引:0,他引:6
本体在语义Web中具有重要的地位,是解决语义层次上Web信息共享和交换的基础。文中介绍了本体的基本概念、描述语言及其在语义Web中的应用、本体映射的基本知识并综述了相关本体映射工程中的具体思想和方法。 相似文献
6.
7.
传统k-means算法由于初始聚类中心的选择是随机的,因此会使聚类结果不稳定。针对这个问题,提出一种基于离散量改进k-means初始聚类中心选择的算法。算法首先将所有对象作为一个大类,然后不断从对象数目最多的聚类中选择离散量最大与最小的两个对象作为初始聚类中心,再根据最近距离将这个大聚类中的其他对象划分到与之最近的初始聚类中,直到聚类个数等于指定的k值。最后将这k个聚类作为初始聚类应用到k-means算法中。将提出的算法与传统k-means算法、最大最小距离聚类算法应用到多个数据集进行实验。实验结果表明,改进后的k-means算法选取的初始聚类中心唯一,聚类过程的迭代次数也减少了,聚类结果稳定且准确率较高。 相似文献
8.
为了改善文本聚类的质量,得到满意的聚类结果,针对文本聚类缺少涉及概念的内涵及概念间的联系,提出了一种基于本体相似度计算的文本聚类算法TCBO(Text Clustering Based on Ontology).该算法把文档用本体来刻画,以便描述概念的内涵及概念间的联系.设计和改进了文本相似度计算算法,应用本体的语义相似度来度量文档间相近程度,设计了具体的根据相似度进行文本聚类的算法.实验证明,该方法从聚类的准确性和聚类的关联度方面改善了聚类质量. 相似文献
9.
10.
基于OWL的本体建模研究 总被引:1,自引:0,他引:1
计算机对语义Web上的文档理解是建立在本体基础之上的,本体是用来定义概念和数据之间的关系的,因此本体建模是非常重要的。介绍了本体与语义Web的关系,并以基于OWL的本体为例,对本体的建模以及相关问题进行研究。 相似文献
11.
12.
本体在语义Web中具有重要的地位,是解决语义层次上Web信息共享和交换的基础.文中介绍了本体的基本概念、描述语言及其在语义Web中的应用、本体映射的基本知识并综述了相关本体映射工程中的具体思想和方法. 相似文献
13.
14.
15.
16.
语义Web与本体的关系极为特殊,本体在语义Web本身的体系结构中扮演着极为重要的角色,同时,位于语义Web体系结构的其它层的XML、RDF(S)等与本体也有着千丝万缕的联系。为阐述两者的关系,探讨基于本体的语义Web的特点及应用,介绍了本体和语义Web的产生和发展,在此基础上对基于本体的语义Web进行研究,重点分析了本体在描述语义方面弥补了XML、RDF(S)等的不足,并结合Web服务检索的实例介绍了本体在Web服务上的应用。 相似文献
17.
映射效率对于Web服务发现和组合、智能空间上下文感知等领域的动态映射至关重要。现有方法对相似度计算方法加以简化来提升效率,但当候选匹配实体对的数目随本体的规模增大而急剧增加时,就无法有效地处理。文中提出一种基于本体分割的高效本体映射算法。通过自下而上的聚类,将本体划分为一组大小合适的本体块。然后基于向量空间算法进行块映射,并从块映射结果中选取实体映射的候选匹配对,从而削减其数量,达到减少时间复杂度的目的。实验表明,文中方法显著提升运行时本体映射的效率,比Falcon-AO本体映射方法快6倍。 相似文献
18.
19.
利用Web资源完成本体构造方法的研究。不仅会缩短本体的构造周期,而且还会扩大本体的应用范围.但由于基于Web的数据提取、知识获取比较困难,与实际应用相比还有一定的距离.该文分析了基于Web本体构造数据源的动态、海量、异质、变化、开放性等特点,本体构造的基础问题——形式化表示方法,总结了本体构造的关键技术及技术难点.初步设计了一个系统结构,为实现基于Web领域本体构造方法提供了一个框架性的思路. 相似文献
20.
《计算机应用与软件》2014,(2)
Web用户聚类是通过分析用户会话,将具有相同或相似访问特征的用户聚为一类。在会话相似性度量方面综合考虑了网页浏览时间和访问频次两个因素,并考虑到用户个人习惯、能力等因素对浏览时间的影响,将浏览时间处理为RDP(Reduce the Differences in Personality)浏览时间,以降低其个性特征。为此,提出一种基于用户特性的RDPk-means聚类算法。实验表明,该算法可以有效实现用户会话的聚类,聚类结果客观合理。 相似文献