首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 234 毫秒
1.
针对多维数据属性对聚类分析结果有不同重要程度影响的问题,提出一种基于自适应属性加权的近邻传播聚类算法。该方法通过考虑多维数据属性权值的重要度,在近邻传播聚类过程中引入属性加权相似性矩阵计算,并根据当前数据聚类划分的结果来分析目标评价函数,计算各个属性对当前聚类的贡献程度。随后根据贡献程度的计算结果自适应地更新属性权值,并通过属性加权相似性矩阵来重新计算近邻传播算法中的两种竞争信息,进而提高聚类结果的质量。数值实验结果表明,新方法能够有效实现属性权值的自适应调整,提高近邻传播算法的聚类效果,与其他传统聚类算法相比新方法具有更好的聚类质量。  相似文献   

2.
该文面向本体关系集合的自动构建,提出一种基于百科词条的本体概念聚类方法,用于发现领域概念之间的语义关系。在给定领域本体概念集合的条件下,该方法首先获取相关的百科词条并建立每一概念的向量模型,然后根据距离判别法进行概念聚类,得到概念间的相近关系。采用该方法对3个领域中的领域概念集合进行聚类,实验结果表明,该文方法比传统聚类算法有更好的聚类结果,有助于概念间关系的自动获取和领域本体自动构建。  相似文献   

3.
针对中文环境下的模式冲突问题,提出了一种利用元数据的模式匹配方法.该方法从数据字典中为模式提取特征向量,并采用聚类技术对其进行聚类,将语义相近的模式划分到相同聚簇中;对于同一聚簇中的不同模式,借助辅助词典计算属性间的语义相似度,并采用多种选择策略相结合的方法对结果进行过滤,为每个属性生成候选匹配集合.实验结果表明,该方法不仅可以提高模式匹配效率,而且具有较高的准确度.  相似文献   

4.
基于图理论的概念间语义度量方法,改进了语义相似度部分影响因素,提出一种结合设计良好的领域本体来计算自然语言概念间的语义相似度的算法.对自然语言与本体的关系进行分析,并通过本体对节点密度、节点深度与节点层次顺序等影响概念语义相似度的因素进行了改进,综合考虑概念的语义距离、概念间关系、概念的属性与概念所处的层次等影响因素,利用本体对相关领域的基本术语和关系的准确定义,改进了基于本体的概念间语义相似度的算法.实验结果表明,该算法对于提高概念间相似度的计算精度明显高于其他算法.  相似文献   

5.
在语义相似度计算中,以往的研究侧重于从正向计算语义的相似性,即通过概念间的路径长度、包含的信息量以及特征等计算概念之间的相关性,从而得到更高的相似性计算结果,而这些结果往往与人类判断的结果偏差较大.然而,在语义相似度的计算过程越来越趋近于模拟人类思考过程的趋势下,考虑语义之间的相异性就变得十分重要.鉴于此,本研究从反向考虑提出了一种将语义之间的相异性加入到语义相似度计算的方法.该方法通过WordNet语料库特有的层次结构深度挖掘概念之间的反义关系,然后用4种不同的策略分别将反义关系代表的相异性以反义因子的形式与已有的方法相结合,通过复现已有方法并将其与反义因子结合进行实验得到最终的语义相似度结果.针对提出的基于相异性的语义相似度计算模型,进一步对模型的参数和相关系数进行了分析和讨论.实验结果表明提出的模型相较于其他方法与人类判断结果具有更高的相关系数,并且该模型可以很好地提升已有的基于路径距离的语义相似度计算方法的准确性.  相似文献   

6.
采用属性聚类的高维子空间聚类算法   总被引:4,自引:1,他引:3  
为了解决现有子空间聚类算法时间复杂度偏高以及对输入参数敏感的问题,提出了一种基于属性聚类方法的高效子空间聚类算法.算法首先通过计算每个属性的基尼值来过滤冗余属性,而后通过基于二维联合基尼值的关系函数建立非冗余属性的关系矩阵,以衡量任意两个非冗余属性的相关度, 进而在关系矩阵上应用可产生交叠的聚类算法,聚类结果即为所有兴趣度子空间的候选集合,最后调用聚类算法得到所有存在于这些子空间内的簇.在人工数据集和真实数据集上的实验表明,新算法不仅在时间复杂度和子空间簇的寻找能力方面均有较优表现,而且对输入参数的取值不甚敏感.  相似文献   

7.
对聚类结果的理解有助于评价聚类效果,可以据此调整聚类过程,更高效地使用聚类结果.但是,聚类结果的理解仍然是一个尚未解决的问题.提出了基于离群点识别技术分析任意聚类算法的聚类结果,发现了聚类结果属性特征簇的方法;提出一种基于不相似性比值的离群点识别算法.通过对全部数据簇的属性描述进行离群点分析,发现各数据簇的特征属性,实现对聚类结果的理解.所提方法适用于任意聚类算法结果的分析.对UCI的iris、ZOO和Housing数据集的采用X-means、Frozen和DBScan算法的聚类结果进行聚类结果分析,实验表明所提方法较成功地发现了不同聚类算法的属性特征簇,有助于对聚类结果的深入理解.  相似文献   

8.
聚类是数据挖掘中的主要方法.讨论了在大多数聚类算法中的相似性测量方法,并以属性的类型作为选择相似性的标准,阐述了用于数值属性,符号属性及混合属性相似性测量方法.  相似文献   

9.
维基百科的中文语义相关词获取及相关度分析计算   总被引:2,自引:0,他引:2  
本文介绍了利用开放式百科全书维基百科获取语义关联词汇,并对语义相关程度进行分析和计算的方法。我们选择并整理了5万余篇维基百科中文语料,并利用超链接关系及词的互现等特征,获得了近40万对在概念或事实存在某种紧密语义关系的词,并简单分析了其聚类特性。进一步我们结合词在文档中的位置、频率等信息对语义相关程度进行了计算,并结合经典算法的相关结果,在不同语义相关度的集合上进行了对比实验,分析了本文获取语义关联词方法的有效性  相似文献   

10.
语义相似度是研究语义交互的一个重要基础,语义交互的结果就是对实例进行语义描述的模型和方法.对网络中的活动节点在局部进行聚类.基于语义相似度聚类成为语义Web发展并被广泛使用必须解决的关键问题,同时也是语义Web智能化的重要研究手段.本文介绍了通过计算语义相似度,到达网络节点聚类的目的.  相似文献   

11.
In order to develop an intelligent case-based reasoning (CBR) system to reuse fixture de- sign knowledge, ontology technology was integrated in CBR system by semantic annotation of fixture design case. Domain ontology of fixture design was constructed; concepts and relations were de- fined and represented. The 2-level similarity evaluation approach of domain ontology was presented. The concept similarity of cases was calculated as the first grade case retrieval. Numerical measure- ment was the second grade case retrieval, which adopted various methods to calculate different types of attribute values. The problem of similarity measurement of fixture design case was resolved. Pro- totype system based on the proposed method was illustrated and the retrieval approach was proved to be efficient.  相似文献   

12.
复杂产品工艺知识的语义本体表达方法   总被引:1,自引:0,他引:1  
针对知识技术在产品工艺知识资源管理的可用性现状,在分析面向企业协同设计的复杂产品工艺知识多元化特点的基础上,提出一种面向语义的复杂机械产品工艺知识领域本体的表示和构建方法,通过利用本体建模工具建立工艺知识本体的结构模型,并采用描述逻辑语言对工艺知识进行形式化描述。针对不同知识本体间在语义层面上的关联,引入产品工艺知识本体概念间相似度和相关度的语义评价方法,设计了一种面向语义的本体概念集关系度量,进一步对语义本体工艺知识进行检索和聚类,保证了复杂产品工艺知识的集成与共享的实现。  相似文献   

13.
基于本体的面向业务协作的异构系统互操作关键技术   总被引:1,自引:0,他引:1  
为了解决目前业务协作过程中异构系统集成困难的问题,提出了基于多层次本体的异构系统互操作框架.该框架以业务协作过程中涉及的关键要素——产品、活动和过程为出发点,为实现协作过程中多要素的语义统一问题,提出了由产品知识本体、活动本体、过程本体组成的多层次本体模型.产品知识本体支持活动本体中的产品描述;活动本体是对过程中每一个步骤或行动的概念、功能、执行情况的描述;过程本体通过控制结构将各个活动连接起来,组成业务过程.采用组合映射理论和语义相似度算法实现不同本体库之间的语义映射和语义集成,从而构成顶层本体库,并通过OWL-S顶层服务本体描述发布和请求Web服务.以服装销售的业务过程为例,采用业务协作互操作机制,通过自行开发原型系统中的本体映射和语义匹配模块,解决了不同企业的订单活动的协作问题.  相似文献   

14.
传统的获取Web服务的方法是通过关键字匹配,由于此方式在发现潜在语义相符的Web服务时较为困难,越来越多的学者研究如何基于语义检索Web服务。本文设计了一种新的语义匹配模式:基于本体服务索引的服务匹配。通过建立从服务到本体库的索引,将本体库和Web服务库关联成一个逻辑整体。通过UDDI,用户请求会直接发送给推理规则库,在得到服务请求后,通过相应推理规则得到领域本体中与服务请求在一定相似度范围内的类及实例,而后将这个结果集输入到本体服务索引,经过匹配可输出较符合的Web服务结果集。  相似文献   

15.
利用基于粗糙集对象属性贴近度的模糊聚类方法,解决信息表中属性值定性和定量描述并存情况的聚类问题。首先,给出对象的属性贴近度公式;然后利用该公式建立模糊矩阵,进而给出聚类方法。最后以实例说明该方法。  相似文献   

16.
为挖掘互联网上的不良信息,本研究借鉴了事件语义分析技术。研究了基于事件本体的Web不良信息挖掘方法,重点是事件本体的构建、文本特征重构。为了验证所提方法的有效性,以信息聚类为例实现了一个基于事件本体的Web不良信息挖掘的原型系统。实验结果表明:基于事件本体和k均值的信息聚类方法的平均准确率为721%,较之传统的基于k均值的信息聚类方法的平均准确率提高了5.3%。  相似文献   

17.
将语义相似度计算模型定义为域、概念、属性组成的三维空间模型,并结合领域本体集,从概念格理论的角度考虑了该模型对语义相似度计算的影响.该模型通过对不同的向量加不同的权值来调节其对语义相似度计算的贡献,使计算结果达到最优,从而提高语义相似度计算的准确度.实验结果表明,与单方面计算相似度的方法相比,该方法能有效地提高语义相似度计算的查全率和查准率.  相似文献   

18.
The information integration method of semantic web based on agent ontology (SWAO method) was put forward aiming at the problems in current network environment, which integrates, analyzes and processes enormous web information and extracts answers on the basis of semantics. With SWAO method as the clue, the following technologies were studied: the method of concept extraction based on semantic term mining, agent ontology construction method on account of multi-points and the answer extraction in view of semantic inference. Meanwhile, the structural model of the question answering system applying ontology was presented, which adopts OWL language to describe domain knowledge from where QA system infers and extracts answers by Jena inference engine. In the system testing, the precision rate reaches 86%, and the recalling rate is 93%. The experimental results prove that it is feasible to use the method to develop a question answering system, which is valuable for further study in more depth.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号