首页 | 本学科首页   官方微博 | 高级检索  
     

通用抽取引擎框架:一种新的Web信息抽取方法的研究
引用本文:宫继兵,唐杰,杨文军.通用抽取引擎框架:一种新的Web信息抽取方法的研究[J].计算机科学,2011,38(1):198-202.
作者姓名:宫继兵  唐杰  杨文军
作者单位:1. 燕山大学计算机科学与工程系,秦皇岛,066004;清华大学计算机科学与技术系,北京,100084
2. 清华大学计算机科学与技术系,北京,100084
3. 中石油规划研究院信息中心,北京,100083
基金项目:本文受国家863高技术研究发展计划(No. 2009AA01Z138)和新教师基金(No. 20070003093)资助。
摘    要:大规模的网络视频信息既为用户信息分享带来了方便,同时也为国家监管部门带来了新的挑战。考虑到效率问题,在线视频监管则主要考虑视频描述信息。主要研究了网络视频描述信息的抽取问题,提出了一种新的Web信息抽取方法:通用抽取引擎框架,其主要包括对视频描述信息抽取问题的形式化描述和用户感知的视频网站逻辑模型。该方法在国家某部委的视频监管项目中已得到应用,并取得了很好的效果。实验结果表明,该方法的扩展性、通用性和抽取准确率大大优于其他方法。

关 键 词:通用抽取引擎框架,网络视频监管,视频网站逻辑模型,Web信息抽取,抽取模式产生算法

General Extraction Engine Framework:Research of a New Approach for Web Information Extraction
GONG Ji-bing,TANG Jie,YANG Wen-jun.General Extraction Engine Framework:Research of a New Approach for Web Information Extraction[J].Computer Science,2011,38(1):198-202.
Authors:GONG Ji-bing  TANG Jie  YANG Wen-jun
Affiliation:(Department of Computer Science and Engineer, Yanshan University, Qinhuangdao 066004, China);(Department of Computer Science and Technology,Tsinghua University,Beijing 100084,China);(Information Center,Planning and Engineering Institute Petrochina Corp. Ltd,Beijing 100083,China)
Abstract:
Keywords:General extraction engine framework  Internet video monitoring  Logical model of video website  Web information extraction  Algorithms for generating extraction patterns
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《计算机科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号