首页 | 本学科首页   官方微博 | 高级检索  
     

基于动态异构的Web信息集成网页分析方法
引用本文:李昌清,李艳霞,李胜利,王剑. 基于动态异构的Web信息集成网页分析方法[J]. 计算机应用研究, 2007, 24(12): 204-206
作者姓名:李昌清  李艳霞  李胜利  王剑
作者单位:河南科技大学,电子信息工程学院,河南,洛阳,471003;华中科技大学,计算机科学与技术学院,武汉,430074;华中科技大学,计算机科学与技术学院,武汉,430074
摘    要:将动态异构的Web信息资源进行抽取以统一的方式供用户查询和使用,是当前迫切需要解决的问题。介绍了分析相关Web页面的方法和经验,实现了自动提交HTML表单获得所需页面和对页面的信息抽取。最后,实验证明了此方法的有效性。

关 键 词:网页分析  信息抽取  模式匹配
文章编号:1001-3695(2007)12-0204-03
修稿时间:2006-09-29

Analysis method based on dynamic and heterogeneous Web pages for information integration
LI Chang qing,LI Yan xi,LI Sheng li,WANG Jian. Analysis method based on dynamic and heterogeneous Web pages for information integration[J]. Application Research of Computers, 2007, 24(12): 204-206
Authors:LI Chang qing  LI Yan xi  LI Sheng li  WANG Jian
Affiliation:(1.College of Electronic Information Engineering, Henan University of Science & Technology, Luoyang Henan 471003, China; 2.College of Computer Science & Technology, Huazhong University of Science & Technology, Wuhan 430074, China)
Abstract:It was an open problem crying for being solved to integrate dynamic and heterogeneous websites for users to query in a uniform way. This paper presented a method of analyzing relevant websites, which implemented the automatic submission of HTML forms to get required websites and the information extraction of websites. The experiment performance demonstrates the efficiency and effectiveness of the method.
Keywords:Web pages analysis   information extraction   pattern matching
本文献已被 维普 万方数据 等数据库收录!
点击此处可从《计算机应用研究》浏览原始摘要信息
点击此处可从《计算机应用研究》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号