首页 | 本学科首页   官方微博 | 高级检索  
     

基于中文宾州树库的浅层语义分析*
引用本文:连乐新,胡仁龙,杨翠丽,袁春风.基于中文宾州树库的浅层语义分析*[J].计算机应用研究,2008,25(3):674-676.
作者姓名:连乐新  胡仁龙  杨翠丽  袁春风
作者单位:南京大学,计算机科学与技术系,计算机软件新技术国家重点实验室,南京,210093
基金项目:国家高技术研究发展计划(863计划) , 国家自然科学基金 , 教育部科技基础条件平台建设项目
摘    要:采用支持向量机的机器学习方法,以中文宾州树库为基础,对中文文本进行了部分语义角色标注实验.选取了主语、宾语、间接宾语、时间和地点这五种主要的语义角色,以中文PropBank 5.0中的前1 652个句子作为实验的训练集和测试集,选择路径、短语类型、谓词、头词、头词词性等八个属性作为分类特征,采用两阶段分类方法,在测试集上得到的总体语义角色标注的准确率和召回率分别为89.73%和91.26%.实验结果表明该方法对中文浅层语义分析工作是有效的.

关 键 词:支持向量机  语义角色标注  中文宾州树库  中文PropBank
文章编号:1001-3695(2008)03-0674-03
修稿时间:2007年1月16日

Shallow semantic parsing based on Chinese Penn Treebank
LIAN Le xin,HU Ren long,YANG Cui li,YUAN Chun feng.Shallow semantic parsing based on Chinese Penn Treebank[J].Application Research of Computers,2008,25(3):674-676.
Authors:LIAN Le xin  HU Ren long  YANG Cui li  YUAN Chun feng
Affiliation:(State Key Laboratory for Novel Software Technology, Dept. of Computer Science & Technology, Nanjing University, Nanjing 210093, China)
Abstract:This paper presented an experiment on semantic role labeling by using SVM.This experiment was based on Chinese PropBank 5.0, which consisted of 1 652 sentences. The role labeling set of this experiment included subject, object, indirect object, time and location.It used two phase classification method with eight features, including path, phrase type, etc.For the small scaled training set, the experiment on testing set could reach the accuracy of 89.73% and the recall of 91.26% for semantic role labeling. Results highlight the effectiveness and efficiency of proposed approach for shallow semantic parsing of Chinese.
Keywords:
本文献已被 维普 万方数据 等数据库收录!
点击此处可从《计算机应用研究》浏览原始摘要信息
点击此处可从《计算机应用研究》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号