首页 | 本学科首页   官方微博 | 高级检索  
     

基于层叠条件随机场的旅游领域命名实体识别
引用本文:郭剑毅,薛征山,余正涛,张志坤,张宜浩,姚贤明. 基于层叠条件随机场的旅游领域命名实体识别[J]. 中文信息学报, 2009, 23(5): 47-53
作者姓名:郭剑毅  薛征山  余正涛  张志坤  张宜浩  姚贤明
作者单位:1. 昆明理工大学 信息工程与自动化学院,云南 昆明 650051;
2. 云南省计算机技术应用重点实验室 智能信息处理研究所,云南 昆明 650051
基金项目:国家自然科学基金资助项目,教育部博士点基金资助项目,云南省中青年学术带头人后备人才基金资助项目,云南省教育厅重点基金资助项目,昆明理工大学博士基金资助项目 
摘    要:针对旅游领域,提出了一种基于层叠条件随机场模型的旅游领域命名实体识别方法。该方法在低层条件随机场中以字为切分粒度,结合旅游景点常用字表、景点常用后缀表、地名常用字表等特征词典,实现简单旅游命名实体的识别;其识别结果传递到高层模型,以词为切分粒度,结合复杂特征,实现嵌套景点、特产风味、地点的识别。最后进行了两组相关实验,结果表明,在开放测试中,层叠条件随机场模型相比于单层模型,F值提高了8个百分点;相比于HMM模型,正确率提高了8个百分点,召回率提高了22个百分点,F值提高了15个百分点。

关 键 词:计算机应用  中文信息处理  旅游领域  命名实体识别  层叠条件随机场  特征模板
  

Named Entity Recognition for the Tourism Domain Based on Cascaded Conditional Random Fields
GUO Jianyi,XUE Zhengshan,YU Zhengtao,ZHANG Zhikun,ZHANG Yihao,YAO Xianming. Named Entity Recognition for the Tourism Domain Based on Cascaded Conditional Random Fields[J]. Journal of Chinese Information Processing, 2009, 23(5): 47-53
Authors:GUO Jianyi  XUE Zhengshan  YU Zhengtao  ZHANG Zhikun  ZHANG Yihao  YAO Xianming
Affiliation:1. The School of Information Engineering and Automation, Kunming University
of Science and Technology, Kunming, Yunnan 650051, China;
2. The Institute of Intelligent Information Processing, Computer Technology Application Key Laboratory
of Yunnan Province, Kunming, Yunnan 650051, China
Abstract:This paper presents a method for named entity recognition in the tourism domain based on the cascaded conditional random fields.This method consists of two steps.The first step is used to identify simple tourism named entities,using Chinese characters as units with the dictionary of common character and suffix in tourism attractions,the dictionary of common character in location names and other dictionaries.Then the results of the first step are sent to the second step,in which the nesting tourist attractio...
Keywords:computer application  Chinese information processing  tourism domain  named entity recognition  cascaded conditional random fields  feature template  
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号