首页 | 本学科首页   官方微博 | 高级检索  
     

ERE:基于半结构化Web页面的实体关系抽取系统
引用本文:余东,李诺,申德荣,汤楠,徐宏斌,寇月,于戈.ERE:基于半结构化Web页面的实体关系抽取系统[J].计算机与数字工程,2014,42(9).
作者姓名:余东  李诺  申德荣  汤楠  徐宏斌  寇月  于戈
作者单位:东北大学信息科学与工程学院 沈阳110819
基金项目:国家自然科学基金,教育部博士点基金,教育部-英特尔信息技术专项科研基金
摘    要:传统的实体关系抽取方法主要针对语义信息较为完整的文本,基于抽取模式抽取文本中的实体关系,并采用启发式算法或者概率模型来选择抽取出的候选关系.而对于半结构化的页面,由于没有成句的实体信息展示,导致这些方法不能很好适用.论文提出的实体关系抽取系统能较好地处理半结构化的页面.该系统主要包括数据抽取规则学习、数据抽取、实体间关系计算等核心功能模块,并为用户提供了关系库查询接口.用户输入关键词和选定匹配类型,系统将根据关键词及匹配类型查询实体信息库,然后用满足条件的实体再去查询实体关系库,将包含这些实体的关系返回给用户.

关 键 词:实体关系  实体关系抽取  数据抽取  实体匹配

ERE: Entity Relationship Extraction System Based on Semi-structured Web Pages
YU Dong,LI Nuo,SHEN Derong,TANG Nan,XU Hongbin,KOU Yue,YU Ge.ERE: Entity Relationship Extraction System Based on Semi-structured Web Pages[J].Computer and Digital Engineering,2014,42(9).
Authors:YU Dong  LI Nuo  SHEN Derong  TANG Nan  XU Hongbin  KOU Yue  YU Ge
Abstract:
Keywords:entity relationship  entity relationship extraction  data extraction  entity matching
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号