基于种子自扩展的命名实体关系抽取方法 |
| |
作者姓名: | 何婷婷 徐超 李晶 赵君喆 |
| |
作者单位: | 华中师范大学计算机科学与技术系,武汉,430079 |
| |
基金项目: | 国家自然科学基金;教育部科学技术基金 |
| |
摘 要: | 命名实体间关系的抽取是信息抽取中的一个重要研究问题,该文提出了一种从大量的文本集合中自动抽取命名实体间关系的方法,找出了所有出现在同一句子内、词语之间的距离在一定范围之内的命名实体对,把它们的上下文转化成向量。手工选取少量具有抽取关系的命名实体对,把它们作为初始关系的种子集合,通过自学习,关系种子集合不断扩展。通过计算命名实体对和关系种子之间的上下文相似度来得到所要抽取的命名实体对。通过扩展关系种子集合的方法,抽取的召回率和准确率都得到了提高。该方法在对《人民日报》语料库的测试中,取得了加权平均值F-Score为0.813的效果。
|
关 键 词: | 命名实体 关系抽取 自学习 |
文章编号: | 1000-3428(2006)21-0183-02 |
收稿时间: | 2005-11-20 |
修稿时间: | 2005-11-20 |
本文献已被 CNKI 维普 万方数据 等数据库收录! |
| 点击此处可从《计算机工程》浏览原始摘要信息 |
|
点击此处可从《计算机工程》下载全文 |
|