首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 296 毫秒
1.
王刚  钟国祥 《计算机科学》2010,37(9):222-224
为了改善文本聚类的质量,得到满意的聚类结果,针对文本聚类缺少涉及概念的内涵及概念间的联系,提出了一种基于本体相似度计算的文本聚类算法TCBO(Text Clustering Based on Ontology).该算法把文档用本体来刻画,以便描述概念的内涵及概念间的联系.设计和改进了文本相似度计算算法,应用本体的语义相似度来度量文档间相近程度,设计了具体的根据相似度进行文本聚类的算法.实验证明,该方法从聚类的准确性和聚类的关联度方面改善了聚类质量.  相似文献   

2.
根据政务信息资源的特点,提出了一种新的政务本体学习模型。首先通过命名实体获取领域概念,然后利用粗糙集和模糊聚类理论对模式匹配算法进行改进,进而采用改进的模式匹配算法获取领域概念之间的显式和隐式关系。大量的实践证明:利用该模型能够从庞大的政务信息资源中有效地进行政务本体学习,克服了传统模式匹配算法不能很好地获取概念之间隐式关系的问题。  相似文献   

3.
实例驱动的自适应本体学习   总被引:1,自引:0,他引:1       下载免费PDF全文
针对知识管理中本体构建存在的问题,将聚类算法与ODP(Open Directory Project)目录有机结合,给出了一种基于知识资源元数据的自适应本体学习方法。根据元数据对文档进行聚类形成本体概念,将生成的概念分别映射到ODP中确定概念间的层次关系,生成初始本体;根据内聚性和相关性的变化进行自适应本体学习,实现本体更新和概念丰富,以及时跟踪知识的变化。提出的自适应本体学习方法能够很好地反映研究领域的演变过程和发展趋势,满足知识型组织进行知识管理和研究人员共享知识的需求。实验结果表明了方法的有效性。  相似文献   

4.
传统中文领域本体构建多采用手工构建的方法,这种方法费时费力且重用率不高。针对这种情况,提出一种把中文领域知识文档半自动化地转化为OWL(Web Ontology Language)本体的方法。该方法以武器装备领域为例,先使用分词工具ICTCLAS5.0对中文文档进行分词等预处理,然后使用TF-IDF算法、基于模板匹配算法挖掘领域核心概念、聚类概念等级关系,再使用Jena将聚类后的三元组文档形式化为OWL本体,最后使用Protégé工具对OWL本体进行可视化管理。实验结果表明,该方法可以有效地节省中文本体构建的时间和人力成本,为全面解决中文领域本体的自动化构建提供了一个新的思路和尝试。  相似文献   

5.
本文探讨了如何利用领域文本集来自动构建领域本体的技术,以辅助知识工程师方便快捷地构建领域本体.文中提出一种利用概念之间的语义相似度,通过蚁群聚类算法对概念集进行聚类,最后利用知网的义原层次结构抽取分类关系的算法,通过非对称簇分析函数评价概念间的关联度,以提取非分类关系,最终生成领域本体.实验证明了该本体学习系统的有效性.  相似文献   

6.
介绍语义Web下本体以及本体构造的一些基本概念,提出一个改进的基于k-means文本聚类算法和本体构造方法,将手工构造的本体和工具构造的本体并进行准确率的计算比较。  相似文献   

7.
为了消除自然语言对构件文本信息描述的二义性以及增强术语间的语义关系,文中采用领域本体的思想,给出了一个基于人工智能领域本体的软件构件聚类模型和基于该模型的聚类算法。该模型通过分析领域的共同概念,形成领域本体知识库,提供领域内一致认可的术语,用于匹配对构件文本描述所使用的自然语言。给出的算法通过与基于传统空间向量的K—Means算法分析比较,验证了该算法是有效的,实现了对软件构件更合理的聚类,提高了构件检索的效率和准确性。  相似文献   

8.
本体是基于本体的信息检索性能优劣的关键。目前的本体学习没有专门针对信息检索的查询扩展和检索结果组织的特点,导致信息检索效果不佳。提出面向信息检索的本体学习框架,采用基于相容类的概念层次关系学习方法,各层领域概念从相容类对应的文档集合提取。然后量化表示领域概念,挖掘概念中的同义词,基于同义词重新建立文档集合的概念空间。将获取的本体应用到信息检索实验中,实验表明该框架获取的本体可提高检索的准确性和效率。  相似文献   

9.
改进的蚁群聚类算法在本体知识库中的应用   总被引:1,自引:0,他引:1  
为了解决基于本体的知识库构建效率不高的问题,将模块化思想引入本体中,并在蚁群聚类算法的基础上,融入遗传算法的种群思想,提出了一种基于改进的蚁群聚类算法的模块化本体的方法。以本体概念间的相似度作为划分模块的主要依据,然后应用改进的蚁群聚类算法得到本体模块划分方案,最后通过实例验证了该方法的有效性。  相似文献   

10.
文档聚类综述   总被引:28,自引:6,他引:28  
聚类作为一种自动化程度较高的无监督机器学习方法,近年来在信息检索、多文档自动文摘等领域获得了广泛的应用。本文首先讨论了文档聚类的应用背景和体系结构,然后对文档聚类算法、聚类空间的构造和降维方法、文档聚类中的语义问题进行了综述。最后还介绍了聚类质量评测问题。  相似文献   

11.
传统联机分析处理(OLAP)系统存在着形式化业务知识参与不足的状况,对深度推理分析造成了制约和局限。为了克服上述缺点,提出一种领域本体驱动的OLAP系统构建方法。首先,通过分析现有本体构建方法的局限性,依托实体类多特征加权相似度判断算法,提出先全局设计后局部抽取的半自动本体构建模式,实现矿山生产领域知识形式化;接着在此基础上,以矿山生产能力关键指标为度量,完成负载业务概念多维本体(MDO)建模;最后,在实际矿山决策系统项目建设中,进行了方法检验。实验结果表明,该方法充分发挥领域本体形式化表达与推理优势,有效整合多源异构信息和明晰多维分析过程,实现内隐知识与关联规则深度挖掘;同时借助高频通用概念视图定义,避免重复维度建模,改进了传统OLAP效能。  相似文献   

12.
电子商务环境下产品本体构建技术研究   总被引:1,自引:0,他引:1  
产品本体通过构建产品类层次及其属性描述为交易双方提供了对产品共享的通用的理解。针对目前电子商务中标准产品本体缺乏产品属性描述的问题,根据电子商务网站中产品信息多以表格形式组织和描述的特点,提出以联合国标准产品与服务分类代码(UNSPSC)为核心本体,结合表格处理技术的半自动产品本体构建方法。以Web表格为对象,对Web表格的识别、表格规范化、单元产品本体及全局产品本体建立进行了研究。这种半自动的本体建立方法可以解决电子商务中的产品信息模型因缺乏标准化的属性描述而产生不一致性,实现对核心产品本体的扩展和补充。  相似文献   

13.
基于非结构化数据的本体学习研究   总被引:4,自引:2,他引:2       下载免费PDF全文
语义Web的创建需要一套共同的标准概念体系,即本体(Ontology)。而现在本体的构造手段仍然是以手工构造为主,效率和准确率都非常低,很容易导致知识获取的瓶颈。近年来,自动创建领域本体可以克服手工方法的不足,成为当前的研究热点之一;本体学习是自动或半自动构建本体的一系列方法和技术。提出了一种利用知网,基于非结构化数据的特定领域概念及其之间关系的提取算法,从军事领域选取4个种子概念:舰、导弹、机和炮,并通过实验测试了该算法。  相似文献   

14.
一种基于语义网的本体映射改进算法   总被引:1,自引:1,他引:0       下载免费PDF全文
针对目前基于语义网的本体映射算法中背景本体搜索面少、本体收集不精确的问题,利用基于虚拟文档的映射技术提取在Word—Net中与概念同义的同义词集,将对单个概念进行搜索转换成对同义概念集进行搜索,从而扩大本体搜索面,获取更多背景本体。提出基于语义环境的动态本体映射算法来排除错误背景本体,使本体收集更加精确。实验结果表明,该算法可有效提高映射的查全率和查准率。  相似文献   

15.
刘晨 《计算机工程》2008,34(20):26-28
如何应对虚拟组织成员本体的变更问题是构建虚拟组织本体面临的主要挑战。该文提出一个半自动的本体构建机制DODO,通过动态捕获并吸收成员本体更新的领域知识来实现虚拟组织本体的不断演化完善。该机制还可辅助领域专家消除虚拟组织本体变更所产生的影响。实际应用表明,使用DODO机制能够保证虚拟组织本体对变更成员本体领域知识的平均覆盖程度始终维持在一个较高的水平。  相似文献   

16.
An ontology is a crucial factor for the success of the Semantic Web and other knowledge-based systems in terms of share and reuse of domain knowledge. However, there are a few concrete ontologies within actual knowledge domains including learning domains. In this paper, we develop an ontology which is an explicit formal specification of concepts and semantic relations among them in philosophy. We call it a philosophy ontology. Our philosophy is a formal specification of philosophical knowledge including knowledge of contents of classical texts of philosophy. We propose a methodology, which consists of detailed guidelines and templates, for constructing text-based ontology. Our methodology consists of 3 major steps and 14 minor steps. To implement the philosophy ontology, we develop an ontology management system based on Topic Maps. Our system includes a semi-automatic translator for creating Topic Map documents from the output of conceptualization steps and other tools to construct, store, retrieve ontologies based on Topic Maps. Our methodology and tools can be applied to other learning domain ontologies, such as history, literature, arts, and music.  相似文献   

17.
针对目前基于语义网的本体映射算法中背景本体搜索面少、本体收集不精确的问题,利用基于虚拟文档的映射技术提取在Word-Net中与概念同义的同义词集,将对单个概念进行搜索转换成对同义概念集进行搜索,从而扩大本体搜索面,获取更多背景本体.提出基于语义环境的动态本体映射算法来排除错误背景本体,使本体收集更加精确.实验结果表明,该算法可有效提高映射的查全率和查准率.  相似文献   

18.
基于Web数据的本体概念抽取   总被引:1,自引:0,他引:1  
本体论(Ontology)在知识管理及语义网(Semantic Web)中越来越重要,但建造本体往往需要耗费大量的时间,且建造完成后本体的维护对知识管理者来说也是费时的工作。自动创建领域Ontology可以克服手工方法的不足,成为当前的研究热点之一;而概念是本体中最重要的组成部分之一,从半结构化的Web文档中自动抽取概念的效率和准确度的高低,直接决定了自动建造的本体的质量,提出一种自动的本体概念抽取模型,此模型不依赖于领域词典或核心本体,并且能达到快速有效地通过对中文Web文本挖掘自动地构建及更新领域本体概念的目的。  相似文献   

19.
刘柏嵩 《计算机工程》2008,34(8):229-231
提出一种通用的多策略本体学习框架,通过对Web上各专业领域文档集进行挖掘来实现本体自动构建。讨论本体学习中本体概念的抽取、概念之间语义关系的抽取和分类体系的自动构建等关键技术,通过实验对算法进行测试和评价。由于集成了多种机器学习算法,该方法在概念抽取和语义关系学习方面具有更高的准确性,采用通用本体WordNet和HowNet作为语料库,可适用于不同的专业领域。通过按需获取Web文档,该方法能实时生成本体。  相似文献   

20.
领域本体建模方法研究   总被引:2,自引:0,他引:2  
介绍了本体的建模准则,详细分析了现有的本体建模方法,在现有的领域本体构建模式的基础上,通过借鉴其它本体的建立模式,提出了一种新的领域本体建模方法.该方法具有很强的逻辑性和可操作性,可被一些领域本体在建立时采用,所述方法用于构建高校教师本体过程中时效果非常好,体现出了该方法符合人类思维和高度可操作性的特点.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号