首页 | 本学科首页   官方微博 | 高级检索  
     

基于本体的异构文本分类系统
引用本文:赵国涛,何钦铭.基于本体的异构文本分类系统[J].计算机工程,2004,30(21):123-125.
作者姓名:赵国涛  何钦铭
作者单位:浙江大学计算机学院,杭州,310027
摘    要:提出了一个基于本体的异构文本分类系统,使用结构本体很好地消除了文本文档的结构上的差异,并将领域本体引入到分类系统中,使得分类更加准确、高效,分类的规则更易理解。在使用COSA算法提取有效概念的同时,也大大地减少了关键术语的数量,节省了运算开销。

关 键 词:本体  异构文本分类系统  知识工程  机器学习  规则
文章编号:1000-3428(2004)21-0123-03

An Ontology-based Heterogeneous Text Categorization System
ZHAO Guotao,HE Qinming.An Ontology-based Heterogeneous Text Categorization System[J].Computer Engineering,2004,30(21):123-125.
Authors:ZHAO Guotao  HE Qinming
Abstract:This paper brings out an ontology-based heterogeneous text categorization system, which exploits structure ontology to avoid the structure difference of text documents, and introduces domain ontology to this text categorization system. All the measures mentioned above make the system more accurate and more effective, the rules for categorization more understandable. When COSA algorithm is used to get meaningful concepts, the number of
Keywords:is reduced enormously      Key words  Ontology  Knowledge engineering  Machine learning  Text categorization  Rule  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号