首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
基于本体的文档自动分类系统的研究   总被引:4,自引:0,他引:4  
讨论了基于本体的文档自动分类系统的意义,给出了系统的框架。利用现有的文档自动分类技术,结合领域本体的分类词汇为文档建立索引。研究人工分类、机器学习分类的结合方法,提出基于“分类一使用一调整”逐步求精的分类方法。结合企业知识管理需求,开发了原型系统,进行了初步验证。  相似文献   

2.
介绍了领域本体的概念,分析了构件自动化组装的阶段和方面,给出了一个基于领域本体的自动化构件组装原型系统(ontology based automated assembly system,OBAAS),介绍了系统整体框架,并对该系统的基于领域本体的构件分类引擎,构件检索匹配和构件接口匹配验证模块的实现思想进行了详细说明,给出了利用朴素贝叶斯分类方法在领域本体基础上对构件的分类的算法、基于领域本体的构件检索和匹配算法,以及部分数据结构的描述。  相似文献   

3.
将本体引入注册分类信息的描述,使用OWL描述注册分类信息本体,从ebXML/RIM中抽象出专门用于管理注册分类信息的注册分类模型,提出了把注册分类信息本体作为注册分类模型的管理对象的设计思想,构造了基于本体的ebXML/R&R注册分类模型。对于实现ebXML/R&R与其它信息资源R&R分类注册方法与技术的互操作性具有重要的理论与实际意义。  相似文献   

4.
本体映射方法研究   总被引:24,自引:0,他引:24  
本体集成是为了解决不同本体之间的共享和交流,其中本体映射是本体集成的一个关键环节。在以往的系统中,本体映射通常是由手工实现的。目前的研究都是朝着实现本体映射的自动或半自动化方向努力。文章对目前本体映射的方法进行了分类,针对本体定义模型,提出了基于语法、基于实例、基于定义、基于层次结构的分类。针对具体映射实现技术。提出了基于规则、基于统计学、基于机器学习的分类。并对每种方法进行了详细描述。这项研究工作可以作为人们提出新的映射方法或者组合的映射方法的一个参考。  相似文献   

5.
分析了药学本体构建的意义,介绍了药学本体构建工具和构建的原则,使用protégě本体编辑器,并借鉴七步法构建思路,详细阐述了药学本体每一步骤的构建过程,包括药学本体需求分析,复用现有本体的可能性分析,药学领域知识的结构化分析和核心概念集的获取,药学本体类、属性和实例的定义.本文的药学本体已应用在基于本体的中文元搜索引擎查询结果自动分类系统中,并能通过系统的运行实现本体的进化.  相似文献   

6.
应急事件的Ontology研究与建模   总被引:1,自引:0,他引:1  
文章对本体的定义和本体的理论方法做了深入研究分析,阐述了使用UML为本体建模的可行性,提出使用RUP支持的UML对应急系统中本体建模的指导性原则。该应急本体建模的混合方法,突破了传统的建立本体方法的局限。应急系统中的本体建模方法的可行性在实际项目中得到了检验。  相似文献   

7.
分析了基于统计进行自动分类的元搜索引擎分类效果缺陷,提出了基于本体进行自动分类的元搜索引擎系统模型,阐述了主要步骤的实现思路,分析了本体在元搜索引擎自动分类中的作用。通过领域本体的语义理解,为用户提供查询概念的语义扩展,使元搜索引擎分类类目结构清晰、逻辑科学、系统,分类效果更加精确。  相似文献   

8.
一种本体学习中分类关系提取方法的研究   总被引:2,自引:0,他引:2  
本体学习技术是利用本体工程技术和机器学习技术等众多学科技术来实现本体的自动半自动构建,可解决本体手工构建的不足。根据本体学习目前的研究现状,提出了一种从文本中半自动获取本体中分类关系的实现,讨论了本体学习中概念抽取和概念间分类关系抽取等关键技术。实现了本体中分类关系提取,对于非分类关系的提取还有待研究。  相似文献   

9.
本体在知识管理和语义网中扮演着越来越重要的角色,但本体的构建是一项费力又费时的工作,为此本文提出一种基于文本分类模式下的本体自动构建方法。该方法以形式化概念理论分析作为基础,计算出概念之间的相关度,以概念间的相关度和它们在文档中出现的频率矩阵构建本体概念图。实验结果表明,在文档分类模式下自动构建本体支持目前的信息分类系统,形成的本体有利于更好地共享和重用,促进语义Web的本体的升级。  相似文献   

10.
基于字典技术的本体整合系统   总被引:5,自引:0,他引:5  
针对本体整合中缺少语义理解的问题,使用字典技术对同义词进行识别,并使用启发式规则计算本体中实体间的相似度。以此为基础,开发了一个半自动化的本体整合系统。该系统为用户整合本体提供帮助,减轻了手工整合本体的工作量,同时提高了本体整合的准确性。  相似文献   

11.
对近年来文本分类的研究现状及新进展进行归纳总结,基于前人的研究基础,提出一个了基于本体的文本分类通用框架,将本体融入传统的基于统计和机器学习的文本分类中,分别从特征处理,分类模型和性能评测等方面进行阐述,分析了现有基于本体的分类研究所面临的挑战,并指出其今后发展趋势。  相似文献   

12.
依据公安情报文本中不同位置的词条对区分文本类别的贡献显著不同的特点,引入位置权重系数,改进了经典的文本特征权重计算方法(TF-IDF),使文本的权重能够更加全面地反映文本的类别信息。根据公安情报分类系统的需求,设计了基于支持向量机(SVM)的公安情报分类系统,该系统不仅能够实现情报文本的自动分类,而且能够保留在情报文本分类的不同阶段语料的特征信息,为情报信息的进一步加工处理提供支持,同时系统中各模块间采用松耦合的方式衔接,提高了系统的适应性和灵活性。通过实验验证了系统设计的合理性和有效性。  相似文献   

13.
文本自动分类系统是信息处理的重要研究方向。针对文本分错类和相似度低找不到合适类别等两种错误 ,提出一种迭代的学习算法 ,它利用分错的文本向量来提高或降低相应类别向量的权重 ,从而纠正分类错误 ,提高了分类准确率 ,并且最终得到了较精确的类别描述向量和较优的分类器。  相似文献   

14.
一种用于大规模文本分类的特征表示方法   总被引:4,自引:0,他引:4       下载免费PDF全文
随着网络和信息技术的迅猛发展,文本分类成为处理和组织大量文档数据的关键技术。文本的特征表示严重地限制了文本分类性能的提升。以经典的向量空间模型和tf-idf权值计算公式为基础,提出了以应用于文本分类为目的的权值改进公式p-idf公式。在比较了贝叶斯、K近邻、神经网络和支持向量机四种典型的文本分类器的基础上,采用支持向量机分类器搭建了一个文本分类试验系统。经过科学的试验比较了tf-idf、p-idf、LTC三种权值公式在文本分类系统中对分类器性能的影响,证实了所提出的p-idf公式的合理性和有效性。  相似文献   

15.
在以往的自动文本分类研究中,大多比较流行的分类技术都是在一个层次上将文本分成几个类别。但随着信息检索的量越来越大,文本的种类将越来越多,仅仅通过一层对海量信息进行组织分类越来越不适合海量信息的检索工作,这种平坦式的分类组织难以进一步提高信息检索的速度。论文将SMO分类算法结合到文本分类研究中,通过构建多层支持向量机文本分类树,实现了基于SMO的多层次文本分类系统。  相似文献   

16.
针对中文文本自动分类算法的评估体系   总被引:1,自引:0,他引:1  
中文文本自动分类能够帮助人们更有效地利用不断膨胀的海量中文信息.现有中文文本自动分类算法基于不同原理,性能各异,适用于不同情况.对于分类算法的比较评估能够确定某个分类算法的适用环境和性能特征.目前缺乏针对中文文本自动分类算法的系统评估体系.本文将引入一个评估体系,并基于该体系实现一个开放的研究平台,得出若干已有中文文本自动分类算法的比较结果.  相似文献   

17.
分析了简单向量距离文本分类算法的不足,提出了相应的改进算法.把反馈思想引入简单向量距离分类模型,使文本分类系统具备了不断学习的能力.实验证明,改进后的文本分类模型适合于文本分类的需要,改善了原有分类器的性能.  相似文献   

18.
Automated text categorization has witnessed a booming interest with the exponential growth of information and the ever-increasing needs for organizations. The underlying hierarchical structure identifies the relationships of dependence between different categories and provides valuable sources of information for categorization. Although considerable research has been conducted in the field of hierarchical document categorization, little has been done on automatic generation of topic hierarchies. In this paper, we propose the method of using linear discriminant projection to generate more meaningful intermediate levels of hierarchies in large flat sets of classes. The linear discriminant projection approach first transforms all documents onto a low-dimensional space and then clusters the categories into hier- archies accordingly. The paper also investigates the effect of using generated hierarchical structure for text classification. Our experiments show that generated hierarchies improve classification performance in most cases.  相似文献   

19.
一种面向专利文献数据的文本自动分类方法   总被引:1,自引:0,他引:1  
中文专利文献自动分类目前尚无成熟适用的方法。分析了文本自动分类的关键技术,并结合专利数据的特点对无词典分词和权重计算进行了改进,提出了一种适用于专利数据分类的层次分类方法,给出了面向专利文献数据的文本自动分类系统的框架模型。实验表明,该系统具有较好的分类精度与效率。  相似文献   

20.
本文提出了一个基于n-gram语言模型进行文本表示,采用链状朴素贝叶斯分类器进行分类的中文文本分类系统。介绍了如何用n-gram语言模型进行文本表示,阐述了链状朴素贝叶斯分类器与n-gram语言模型相结合的优势,分析了n-gram语言模型参数的选取,讨论了分类系统的若干重要问题,研究了训练集的规模和质量对分类系统的影响。根据863计划文本分类测评组所提供的测试标准、训练集以及测试集对本文所设计的分类系统进行测试,实验结果表明该分类系统有良好的分类效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号