首页 | 本学科首页   官方微博 | 高级检索  
     

中文微博命名实体识别
引用本文:邱泉清,苗夺谦,张志飞.中文微博命名实体识别[J].计算机科学,2013,40(6):196-198.
作者姓名:邱泉清  苗夺谦  张志飞
作者单位:同济大学计算机科学与技术系 上海201804;同济大学嵌入式系统与服务计算教育部重点实验室 上海200092
基金项目:本文受国家自然科学基金项目(60970061,6,61103067),中央高校基本科研业务费专项资金资助
摘    要:微博这一媒体形式的迅速发展为命名实体识别提供了一个新的载体.根据微博文本的特点,提出针对中文微博的命名实体识别方法.首先,对微博文本做规范化处理,消除由于微博表达不规范造成的干扰;在建立中文人名库、常用地点库等知识库的基础上,选取适合微博的特征模板,使用条件随机场方法进行实体识别;同时,将正确的识别结果添加到知识库中以提升识别效果.在真实微博数据上的实验表明,该方法能够有效地完成中文微博的命名实体识别任务.

关 键 词:中文信息处理  微博  命名实体  条件随机场
收稿时间:2012/9/10 0:00:00
修稿时间:2012/12/15 0:00:00

Named Entity Recognition on Chinese Microblog
QIU Quan-qing,MIAO Duo-qian and ZHANG Zhi-fei.Named Entity Recognition on Chinese Microblog[J].Computer Science,2013,40(6):196-198.
Authors:QIU Quan-qing  MIAO Duo-qian and ZHANG Zhi-fei
Affiliation:Department of Computer Science and Technology,Tongji University,Shanghai 201804,ChinaKey Laboratory of Embedded System and Service Computing,Ministry of Education,Tongji University,Shanghai 200092,China;Department of Computer Science and Technology,Tongji University,Shanghai 201804,ChinaKey Laboratory of Embedded System and Service Computing,Ministry of Education,Tongji University,Shanghai 200092,China;Department of Computer Science and Technology,Tongji University,Shanghai 201804,ChinaKey Laboratory of Embedded System and Service Computing,Ministry of Education,Tongji University,Shanghai 200092,China
Abstract:
Keywords:Chinese information processing  Microblog  Named entity  Conditional random fields
本文献已被 万方数据 等数据库收录!
点击此处可从《计算机科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号