首页 | 本学科首页   官方微博 | 高级检索  
     

基于结果模式的Deep Web数据抽取
引用本文:马安香,张斌,高克宁,齐鹏,张引.基于结果模式的Deep Web数据抽取[J].计算机研究与发展,2009,46(2).
作者姓名:马安香  张斌  高克宁  齐鹏  张引
作者单位:东北大学信息科学与工程学院,沈阳,110004
基金项目:国家自然科学基金,辽宁省科学技术基金 
摘    要:高效、准确地获取Deep Web数据是实现Deep Web数据集成系统的关键问题,然而重复语义标注、嵌套属性的存在是Deep web数据抽取效率和准确率难以提升的瓶颈问题.因此提出基于结果模式的Deep Web数据抽取机制,将数据抽取工作分为结果模式生成和数据抽取两个阶段,属性语义标注放在结果模式生成阶段来完成,有效解决了重复语义标注问题;同时针对嵌套属性问题,提出一种有效的解决方法.与同类成果相比,基于结果模式的数据抽取方法提高了数据抽取的准确率及效率,并且为Deep Web数据集成奠定了良好的基础.

关 键 词:Deep  Web数据集成  Deep  Web数据抽取  结果模式  语义标注  网页数据特征矩阵

Deep Web Data Extraction Based on Result Pattern
Ma Anxiang,Zhang Bin,Gao Kening,Qi Peng,Zhang Yin.Deep Web Data Extraction Based on Result Pattern[J].Journal of Computer Research and Development,2009,46(2).
Authors:Ma Anxiang  Zhang Bin  Gao Kening  Qi Peng  Zhang Yin
Affiliation:College of Information Science and Engineering;Northeastern University;Shenyang 110004
Abstract:With the rapid development of World Wide Web,how to improve the efficiency and precision of Deep Web data extraction has already become more and more important for effective Deep Web data integration. However,the bottleneck problem of the improvement of efficiency and precision of Deep Web data extraction is repeatedly semantic annotating and the existing of nested attributes. The definition of result pattern is given,and a novel approach to Deep Web data extraction based on result pattern is proposed. The ...
Keywords:Deep Web data integration  Deep Web data extraction  result pattern  semantic annotation  feature matrix of Web page data  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号