首页 | 本学科首页   官方微博 | 高级检索  
     

在线旅游业务中Web页面主体块提取方法研究
引用本文:白鹤,赵志强,王劲林.在线旅游业务中Web页面主体块提取方法研究[J].微计算机信息,2010(15).
作者姓名:白鹤  赵志强  王劲林
作者单位:中国科学院研究生院;中国科学院声学研究所国家网络新媒体工程技术研究中心;
基金项目:基金申请人:赵志强;项目名称:国家高技术研究发展计划项目“融合型旅游在线服务业务的研究”;基金颁发部门:中华人民共和国科学技术部(2008AA01A307)
摘    要:Web信息提取是在线旅游业务的重要技术。页面的主体语义块集中了最主要的信息量,它的正确提取是Web信息提取的基础。本文在对现有页面分割方案总结的基础上,提出了结合机器学习方法的Web页面主体语义块节点识别算法,并基于启发式规则对正结果集进行后续的校验,以定位最佳的主体语义块节点。通过实验,本文提出的方案达到了比较理想的准确率。

关 键 词:Web信息提取  支持向量机  主体语义块  

Research on Retrieving Main Segmentation of Web Pages in E-Travel
BAI He ZHAO Zhi-qiang WANG Jin-lin.Research on Retrieving Main Segmentation of Web Pages in E-Travel[J].Control & Automation,2010(15).
Authors:BAI He ZHAO Zhi-qiang WANG Jin-lin
Affiliation:BAI He ZHAO Zhi-qiang WANG Jin-lin(Graduate University of Chinese Academy of Sciences,Beijing,100049,China)(Institute of Acoustics,Chinese Academy of Sciences,National Network New Media Engineering Research Center,100190,China)
Abstract:
Keywords:Information Retrieval  Support Vector Machine  Main Semantic Segmentation  
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号