首页 | 本学科首页   官方微博 | 高级检索  
     

自适应式的海量半结构化数据采集引擎研究与设计
引用本文:王宇,张宁,许卓群. 自适应式的海量半结构化数据采集引擎研究与设计[J]. 计算机应用研究, 2003, 20(9): 65-68,90
作者姓名:王宇  张宁  许卓群
作者单位:北京大学,计算机科学技术系,人工智能实验室,北京,100871
摘    要:在当今的信息时代,网上每天都有海量的数字化信息在生成、存储、传播和转换。这种趋势不可避免地加剧了信息获取的困难,如何有效地利用这些海量信息也成为了亟待解决的难题。给出了一个自适应式的海量半结构化数据采集引擎(AEEMSI)的框架,提出了自适应数据模板、数据网关等概念,并利用此结构框架,开发设计出了可投入实际商业应用的运行系统,完成了对Web中的海量半结构化信息进行提取和重新整合的工作。

关 键 词:信息提取 半结构化数据 自适应数据模板 自适应数据网关
文章编号:1001-3695(2003)09-0065-04

Study and Design of an Adaptive Extraction Engine Based on Massive Semi-structural Information
Abstract:
Keywords:Information Extraction  Semi-structural Information  Adaptive Data Template  Adaptive Data Gateway
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号