首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
王刚  钟国祥 《计算机科学》2010,37(9):222-224
为了改善文本聚类的质量,得到满意的聚类结果,针对文本聚类缺少涉及概念的内涵及概念间的联系,提出了一种基于本体相似度计算的文本聚类算法TCBO(Text Clustering Based on Ontology).该算法把文档用本体来刻画,以便描述概念的内涵及概念间的联系.设计和改进了文本相似度计算算法,应用本体的语义相似度来度量文档间相近程度,设计了具体的根据相似度进行文本聚类的算法.实验证明,该方法从聚类的准确性和聚类的关联度方面改善了聚类质量.  相似文献   

2.
一种跨本体的语义相似度计算方法   总被引:2,自引:0,他引:2  
针对在广域分布环境下进行信息共享与服务的需要,本文设计了基于本体的元数据模型,并在MD3模型的基础上给出了一种基于该元数据模型的跨本体的语义相似度计算方法.MD3模型是一种系统的跨本体概念间相似度的计算方法,这种方法无需建立一个集成的共享本体.在MD3模型的基础上,充分利用本体对概念的描述信息,重点讨论了跨本体概念间非层次关系相似度的计算,把MD3模型扩展到MD4模型,使得概念间相似度的计算理论上更全面、更精确.  相似文献   

3.
基于语义相似度与优化的构件聚类算法   总被引:1,自引:2,他引:1  
为克服刻面分类表示法的人为主观因素,采用了刻面分类与全文检索相结合的方法对构件进行了表示.同时,从语义角度出发,结合优化技术,提出了一种基于语义相似度与优化的构件聚类算法.该算法有效地减少了刻面分类的主观性因素,进一步提高了构件查询的效率和准确性,并与基于向量空间模型的构件聚类效果进行比较.实验结果表明,基于语义相似度与优化的构件聚类算法的有效性,它在一定程度上改善了构件聚类的效果,提高了聚类质量.  相似文献   

4.
基于本体及相似度的文本聚类研究*   总被引:1,自引:0,他引:1  
为了改善文本聚类的质量,得到满意的聚类结果,针对文本聚类忽略概念的内涵及缺少概念间的联系,设计和改进了基于本体和相似度的文本聚类方法TCBOS(text clustering based on ontology and similarity)。研究了文本预处理及分词的方法,设计了用有限状态自动机来自动提取概念和关系的方法,对概念语义扩展和相似度计算方法进行了改进和完善,通过应用本体的语义相似度来度量文档间相近程度,完善了根据相似度进行文本聚类的K中心点算法。实验证明,该方法从聚类的准确性和聚类的关联度方  相似文献   

5.
一种基于上下文的语义相似度算法   总被引:2,自引:0,他引:2  
本体中概念映射的关键是概念相似度计算.本文针对目前概念相似度计算所存在的问题,提出了一种基于上下文的计算本体内概念间语义相似度的算法,从概念的父代和子代两个角度进行计算.该算法充分考虑了概念所处的具体应用环境,利用了本体中概念的语义信息.实验结果表明,基于上下文的语义相似度算法比单纯地计算概念闻语义相似度更有效.  相似文献   

6.
由于目前检索技术效率低下,所以需要一种基于本体的检索技术来提高效率。语义相似度计算是基于本体的检索技术的一个关键问题。本文对已有语义相似度计算方法进行总结并改进,最后对其进辑分析  相似文献   

7.
提出一种基于概念和语义相似度的聚类算法TCBCSS(Text Clustering Based on Concept and Semantic Similarity),TCBCSS算法基于WordNet对文档概念进行抽取和归并,形成语义网络,利用小世界理论和网络的几何特性对其进行分析并构建概念列表来表示文档,不仅有效解决了“表达差异”问题也有利于文档相似度的计算。TCBCSS算法利用两个概念列表的语义相似度作为文档间相近程度的度量,以图为基础进行聚类分析,避免了有些聚类算法对聚簇形状的限制,试验证明TCBCSS算法提高了聚类质量。  相似文献   

8.
一种基于本体的语义相似度算法研究   总被引:1,自引:0,他引:1  
赵永金  郑洪源  丁秋林 《计算机应用》2009,29(11):3074-3076
在研究目前比较经典的基于语义距离的相似度算法的基础上,通过分析语义概念的其他关键因子,增加了节点密度以及概念属性对语义相似度的影响,提出了一个更为规范的相似度算法。通过实验分析证明,改进后算法所得相似度值更加合理,在一定的调节参数下,与人类主观判断的兼容度比原始算法提高了约15%。  相似文献   

9.
MD4:一种综合的跨本体实体语义相似度计算方法*   总被引:2,自引:0,他引:2  
面向广域分布环境下信息资源共享与服务的需要,设计了基于本体的元数据模型,并在MD3模型的基础上给出了一种基于该元数据模型的跨本体的语义相似度计算方法——MD4模型。MD4充分利用本体对实体的描述信息,重点讨论了实体名称、实体属性、实体语义环境以及实体实例等相似度的计算,把MD3模型扩展到MD4模型,使得信息资源实体间语义相似度的计算更全面、精确。  相似文献   

10.
基于语义网的语义相似度算法改进   总被引:20,自引:4,他引:16  
传统的语义相似度算法采用纯语义距离或以本体库的统计特性为基础。论文的改进算法把这两者结合起来,互为约束,并且加入了“深度”和“密度”对语义距离的辅助影响。改变语义相关性的比重只需调节算法中的一个参数。最后通过WordNet构造的局部语义树,比较了各算法的有效性。  相似文献   

11.
唐雅媛  徐德智  赖雅 《计算机工程》2012,38(5):170-172,175
现有语义相似度计算方法没有充分利用本体中的语义信息,且计算方法复杂。为此,提出一种基于概念特征的语义相似度计算方法。根据概念在本体中的层次结构来确定特征集合,引入宽度影响因子,给每个特征赋予不同的权值,通过计算2个概念特征集合间的相似度得到概念的相似度,引入深度影响因子,将相似度公式表示成更直观的形式。实验结果表明,该方法计算简便,且比较接近人类主观的判断值。  相似文献   

12.
语义相似度是语义网络和信息检索领域的重要内容.本体结构为语义相似度计算提供了新的思路,但现有的方法都存在着不同程度的缺陷.为了提高已有方法的有效性,在分析语义相似度经典方法的基础上,充分利用本体的结构信息,综合考虑概念在本体图中的位置、语义距离,共享属性量和共享信息等因素,提出了一个基于本体结构的语义相似度算法.实验部分以维基百科中公开发布的氨基酸本体为例,通过与经典方法计算结果的对比,证明了算法的有效性.  相似文献   

13.
基于上下文的概念语义相似度计算模型   总被引:2,自引:0,他引:2       下载免费PDF全文
吕林涛  董迎 《计算机工程》2010,36(21):59-61
针对概念语义相似度计算方法在信息检索中存在的漏检、误检等问题,提出一种基于上下文的计算本体内概念间语义相似度的模型。该模型分别从概念的父节点、子节点以及概念间路径权重3个角度进行计算,加权求和并求得语义相似度。实验结果表明,该模型的计算结果更加接近专家的经验值,为概念之间的语义关系提供了有效的量化。  相似文献   

14.
基于本体结构的概念间语义相似度算法   总被引:2,自引:0,他引:2       下载免费PDF全文
针对本体模型的结构特点,从模型概念间的宽度、深度、密度等方面分析本体概念相似度的计算,将其合并为结构因素。结合语义重合度、语义距离等影响相似度的因素综合考虑,提出一种基于本体结构的计算概念间语义相似度的算法。通过建立本体模型并进行实验分析,总结出本体结构方面各因素对本题概念语义相似度的影响。  相似文献   

15.
基于基因本体的语义相似度研究   总被引:3,自引:0,他引:3       下载免费PDF全文
魏韡  向阳  陈千 《计算机工程》2010,36(20):209-210
针对基因本体的有向无环图结构,提出一种新的计算基因本体中术语间语义相似度的方法。该方法通过计算2个术语的公共祖先及符合条件的不相交祖先,得到不相交祖先的信息量平均值和2个术语的信息量平均值,并将2个平均值的比值作为2个术语的语义相似度。实验结果证明该方法准确度较高。  相似文献   

16.
基于向量空间模型(VSM)的文本聚类会出现向量维度过高以及缺乏语义信息的问题,导致聚类效果出现偏差。为解决以上问题,引入《知网》作为语义词典,并改进词语相似度算法的不足。利用改进的词语语义相似度算法对文本特征进行语义压缩,使所有特征词都是主题相关的,利用调整后的TF-IDF算法对特征项进行加权,完成文本特征抽取,降低文本表示模型的维度。在聚类中,将同一类的文本划分为同一个簇,利用簇中所有文本的特征词完成簇的语义特征抽取,簇的表示模型和文本的表示模型有着相同的形式。通过计算簇之间的语义相似度,将相似度大于阈值的簇合并,更新簇的特征,直到算法结束。通过实验验证,与基于K-Means和VSM的聚类算法相比,文中算法大幅降低了向量维度,聚类效果也有明显提升。  相似文献   

17.
基于语义覆盖网络的信息组织与服务体系框架   总被引:1,自引:0,他引:1       下载免费PDF全文
针对广域网络环境下面向用户需求的信息服务要求,本文设计了一种基于语义覆盖网络的信息组织与服务体系框架。该框架充分考虑用户的信息需求与信息体系,提供了一种趋于扁平化的信息共享与服务环境。该框架通过自底向上和自顶向下相结合的信息组织模式,在信息资源中心完成基于语义的信息整合与组织的基础上采用基于语义相似度聚类的语义覆盖网络,提供基于语义的信息资源发布、发现与定位的能力。  相似文献   

18.
借助目前丰富的网络资源,将同一主题的现存Ontology知识聚类,提供给领域专家或用户进行二次精化和集成是Ontology研究领域的一个重要课题.OWL是目前用于表示和交换Ontology信息的基本标准.本文从OWL的语义本质出发,考虑了知识之间的继承性及复杂类比较和模糊集运算的相似性,提出一种计算OWL文档语义相似性的方式,并和层次聚类算法集成完成了对OWL文档集的聚类实验.实验结果说明本文提出的算法对自动生成和手工建立的OWL文档集都有很好的效果。  相似文献   

19.
基于领域本体的语义相似度计算研究   总被引:3,自引:0,他引:3       下载免费PDF全文
本文介绍了有关本体的知识以及在领域本体参照下三种语义相似度的计算模型,并针对这三种计算模型的优缺点和领域本体所特有的性质提出了一种改进的基于领域本体的语义相似度计算模型.该计算模型的基本思想是:以基于距离的计算模型为基础,把概念的信息内容和概念的属性作为两个决策因子.实验结果表明,该方法能够比较准确地反映概
念之间的语义关系,为概念之间的语义关系提供一种有效的量化.  相似文献   

20.
论文提出一个基于语义的文本间的相似度算法,以文本的特征词相似度为基础,来计算文本间的相似度,利用聚类算法对文本簇进行聚类.实验结果证明基于知网的文本语义相似度方法在对文本相似度计算以及文本聚类方面,能有效提高聚类的效果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号