首页 | 本学科首页   官方微博 | 高级检索  
     

一种介词-动词模式的获取方法
作者姓名:吴昱明  曹存根
作者单位:首都师范大学计算机联合研究院,北京,100037;中国科学院计算技术研究所,北京,100080;中国科学院计算技术研究所,北京,100080
基金项目:国家自然基金(60496326,60573063,60573064和60773059); 863课题(2007AA01Z325)的资助
摘    要:基于模式的知识获取方法研究是当前文本知识获取的重点研究之一,如何获得文本知识模式是该研究中的一个重要研究内容。提出一种新的基于介词和动词模式(称为PV模式)的获取方法。首先构造出一个候选的动词介词组合(称为PV组合),使用统计方法对其进行过滤。度量PV组合好坏有两个标准:一个是模式词的表示能力,另一个是模式词与概念词之间及多个概念词之间的相关性。依据这两个标准构造了6个数值特征,通过训练产生了3个分类器,采用交叉验证的方式估计出3个分类器的精度分别达到0.853,0.862和0.856。这些分类器为从PV组合中自动挑选PV模式提供依据。

关 键 词:文本知识获取  文本模式获取  模式分类
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号