首页 | 本学科首页   官方微博 | 高级检索  
     

基于PowerBuilder的网页数据抓取
引用本文:刘书华,陈国奎. 基于PowerBuilder的网页数据抓取[J]. 计算机系统应用, 2009, 18(2): 171-175
作者姓名:刘书华  陈国奎
作者单位:衡水学院,数学与计算机科学系,河北,衡水,053000
基金项目:衡水学院青年专项课题基金项目(2008057)
摘    要:互联网飞速发展,WEB已经成为一个巨大的信息资源库,各行各业的信息均可以在互联网上找到。及时准确的获得、存贮、分析、利用这些信息是非常重要的。利用PowerBuilder和MicroSoft SQL Server数据库,提出了一种对网页的数据抓取的方法。用户首先选定样本页面,其次在样本中预先定义抓取模式,然后对样本网页和其中的样本进行标记,形成信息的抓取规则,进行数据抓取,并存入数据库。最后利用数据库对信息进行分类,抽取出所需的信息,达到分析准确、抓取速度快的目的。

关 键 词:HTML 模式 数据抓取 抓取器 数据挖掘

Web Data Extraction Based on PowerBuilder
Abstract:
Keywords:HTML
本文献已被 维普 万方数据 等数据库收录!
点击此处可从《计算机系统应用》浏览原始摘要信息
点击此处可从《计算机系统应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号