首页 | 本学科首页   官方微博 | 高级检索  
     

网络环境下海量信息的局部模式提取方法
引用本文:王腾蛟,唐世渭,杨冬青,刘云峰. 网络环境下海量信息的局部模式提取方法[J]. 软件学报, 2001, 12(11): 1639-1646
作者姓名:王腾蛟  唐世渭  杨冬青  刘云峰
作者单位:北京大学计算机科学技术系,
基金项目:国家重点基础研究发展规划973资助项目(G1999032705);北京大学-IBM创新研究院资助项目
摘    要:海量信息的模式提取是网络环境下海量信息集成研究的难点.给出了一种新的局部精确模式提取及其增量保持方法,通过探测目标集的路径距离,利用Hash类及其路径距离操作,将模式的生成规模控制在"模式直径"范围内,从而有效地抑制了模式膨胀.

关 键 词:海量信息  半结构化数据  模式提取  数据模型  信息集成
文章编号:1000-9825-2001-12(11)1639-08
收稿时间:2000-05-09
修稿时间:2000-07-06

Extracting Local Schema from Massive Information in Network Environment
WANG Teng jiao,TANG Shi wei,YANG Dong qing and LIU Yun feng. Extracting Local Schema from Massive Information in Network Environment[J]. Journal of Software, 2001, 12(11): 1639-1646
Authors:WANG Teng jiao  TANG Shi wei  YANG Dong qing  LIU Yun feng
Abstract:Extracting schema from massive information is very difficult for the research on massive information integration in network environment. A new method is presented in this paper, which is about extracting and incremental maintenance of local accurate schema. In this process, the algorithm control the scale of extracted schema within the 'schema diameter' by examining the path distance of the target set and using the Hash class and its path distance operation. This method is very efficient for restrain schema from expanding.
Keywords:global information   semi structured data   extracting schema   data model   information integration
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《软件学报》浏览原始摘要信息
点击此处可从《软件学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号