首页 | 官方网站   微博 | 高级检索  
     

语义分析中谓词标识的特征工程
引用本文:汪红林,王红玲,周国栋.语义分析中谓词标识的特征工程[J].计算机工程与应用,2010,46(9):134-137.
作者姓名:汪红林  王红玲  周国栋
作者单位:1.苏州大学 计算机科学与技术学院,江苏 苏州 215006 2.江苏省计算机信息处理技术重点实验室,江苏 苏州 215006
基金项目:国家自然科学基金(No.60673041);;国家高技术研究发展计划(863)(No.2006AA01Z147);;高等院校博士学科点专项科研基金(No.20060285008)~~
摘    要:谓词是句子中的最重要的成分,它的正确与否对语义分析的影响非常大。而众多的特征直接影响到谓词标识的性能,如何组织这些特征显得尤为重要。选取了7个基本特征和30多个新特征以及它们的组合,使用最大熵分类器,在基本特征的基础上通过增加有利特征的方法,使得谓词标注的F1值增长了约5%(由84.7%增加到89.8%),词义识别的F1值增长了约2%(由80.3%增加到82.1%),结果表明,这些新特征及其组合大大提高了性能。

关 键 词:谓词标注和词义识别  语义分析  特征工程  最大熵分类器  
收稿时间:2008-9-26
修稿时间:2009-1-17  

Feature engineering for predicate identification and classification in semantic analysis
WANG Hong-lin,WANG Hong-ling,ZHOU Guo-dong.Feature engineering for predicate identification and classification in semantic analysis[J].Computer Engineering and Applications,2010,46(9):134-137.
Authors:WANG Hong-lin  WANG Hong-ling  ZHOU Guo-dong
Affiliation:1.School of Computer Science and Technology,Soochow University,Suzhou,Jiangsu 215006,China 2.Jiangsu Provincial Key Laboratory of Computer Information Processing Technology,Suzhou,Jiangsu 215006,China
Abstract:Predicate is the most important component in a sentence,which greatly influences the identification of the semantic analysis.The performance of predicate identification and classification relies on lots of features,but how to combine those features is more important.This paper picks out 7 basic features and over 30 new features with different combinations.By adding useful combinations of the features into the baseline system with the maximum entropy classifier,it improves by 5% of F1-score(from 84.7% up to ...
Keywords:predicate identification and predicate classification  semantic analysis  feature engineering  maximum entropy classifier
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程与应用》浏览原始摘要信息
点击此处可从《计算机工程与应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号