首页 | 本学科首页   官方微博 | 高级检索  
     

基于概念网络的短文本分类方法
引用本文:林小俊,张猛,暴筱,李军,吴玺宏.基于概念网络的短文本分类方法[J].计算机工程,2010,36(21):4-6.
作者姓名:林小俊  张猛  暴筱  李军  吴玺宏
作者单位:(1. 北京大学机器感知与智能教育部重点实验室,北京 100871;2. 北京市朝阳区档案局,北京 100020)
基金项目:国家自然科学基金资助项目,国家"863"计划基金资助项目,北京市档案科技基金资助项目
摘    要:针对档案领域的短文本分类,设计一种基于概念网络的自动分类方法。通过分析领域内短文本的语言特点构建领域本体,利用自然语言处理技术将短文本转化为资源描述框架表示的结构化概念网络,在此基础上定义概念网络间的语义相似度,从而实现档案的自动分类。实验结果表明,相比传统基于特征选择的短文本分类方法,该方法的分类错误率下降了24.2%,可有效改善系统性能。

关 键 词:短文本分类  概念网络  文档相似度  领域本体

Short-text Classification Method Based on Concept Network
LIN Xiao-jun,ZHANG Meng,BAO Xiao,LI Jun,WU Xi-hong.Short-text Classification Method Based on Concept Network[J].Computer Engineering,2010,36(21):4-6.
Authors:LIN Xiao-jun  ZHANG Meng  BAO Xiao  LI Jun  WU Xi-hong
Affiliation:(1. Key Laboratory of Machine Perception, Ministry of Education, Peking University, Beijing 100871, China; 2. Beijing Chaoyang District Archives Bureau, Beijing 100020, China)
Abstract:
Keywords:short-text classification  concept network  document similarity  domain ontology
本文献已被 维普 万方数据 等数据库收录!
点击此处可从《计算机工程》浏览原始摘要信息
点击此处可从《计算机工程》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号