首页 | 本学科首页   官方微博 | 高级检索  
     

基于分块重要性模型与Xpath的Web信息抽取的研究
引用本文:庞秋奔,顾平,杨小梅. 基于分块重要性模型与Xpath的Web信息抽取的研究[J]. 计算机与现代化, 2009, 0(8): 73-75,79. DOI: 10.3969/j.issn.1006-2475.2009.08.020
作者姓名:庞秋奔  顾平  杨小梅
作者单位:广西大学计算机电子信息学院,广西,南宁,530004
摘    要:网页分块方法使得Web信息抽取的单位由页面缩小为块.文中研究了网页分块的主要方法与基于学习的分块重要性模型,对Xpath的Web抽取方法进行分析.结合两者的优势提出一种基于分块重要性模型与Xpath结合的Web信息抽取方法,探讨了其设计过程,并给出形式化描述与实验结果,结果表明该方法适合于抽取多记录型的网页.

关 键 词:网页分块  块重要性权重  Web信息抽取

Research on Web Information Extraction Based on Combining Block Importance Model and Xpath
PANG Qiu-ben,GU Ping,YANG Xiao-mei. Research on Web Information Extraction Based on Combining Block Importance Model and Xpath[J]. Computer and Modernization, 2009, 0(8): 73-75,79. DOI: 10.3969/j.issn.1006-2475.2009.08.020
Authors:PANG Qiu-ben  GU Ping  YANG Xiao-mei
Affiliation:School of Computer;Electronics and Information;Guangxi University;Nanning 530004;China
Abstract:
Keywords:Xpath  page segment  value of block importance  Xpath  Web information extraction
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号