首页 | 本学科首页   官方微博 | 高级检索  
     

半结构化数据的模式抽取
引用本文:蒙德龙,叶飞跃,李旭华. 半结构化数据的模式抽取[J]. 计算机工程与应用, 2006, 42(27): 162-165
作者姓名:蒙德龙  叶飞跃  李旭华
作者单位:上海大学计算机工程与科学学院,上海,200072
摘    要:模式抽取在半结构化数据研究领域中具有重要意义。论文结合同类对象集和标签路径的概念,提出了一种从OEM模型中抽取模式的新方法。算法的基本思想是:在用OEM模型表示的半结构化数据中查找同类对象集,并通过构造模式表的方法来实现模式抽取。这种方法不但能从层次结构数据中抽取模式,而且还能从包含环路的OEM数据中进行模式抽取,克服了其它一些算法不能从带有环路的数据中进行模式抽取的缺点。

关 键 词:半结构化数据  OEM  同类对象  模式表  模式抽取
文章编号:1002-8331-(2006)27-0162-04
收稿时间:2005-12-01
修稿时间:2005-12-01

Extracting Schema from Semistructured Data
MENG De-long,YE Fei-yue,LI Xu-hua. Extracting Schema from Semistructured Data[J]. Computer Engineering and Applications, 2006, 42(27): 162-165
Authors:MENG De-long  YE Fei-yue  LI Xu-hua
Affiliation:School of Computer Engineering and Science,Shanghai University,Shanghai 200072
Abstract:Extracting schema is important in the field of semistructured data research.This paper presents a new approach to this topic with the conception of homo-object set and label path.The new approach finishes extracting schema by tow steps:firstly,searching all homo-object sets from OEM model;secondly,constructing schema table.This approach not only extracts schema from level structured data,but also from OEM data which include circle,while some other approaches can not extract schema from OEM data which include circle.
Keywords:OEM
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号