首页 | 本学科首页   官方微博 | 高级检索  
     

一种基于树匹配的网页语义块挖掘算法
引用本文:刘守群,朱明,谭晓彬.一种基于树匹配的网页语义块挖掘算法[J].小型微型计算机系统,2009,30(8).
作者姓名:刘守群  朱明  谭晓彬
作者单位:中国科学技术大学,安徽省网络传播系统与控制重点实验室,安徽,合肥,230087
基金项目:国家"八六三"高技术研究发展计划基金项目,国家"八六三"高技术研究发展计划基金项目 
摘    要:在互联网中,网页等半结构化文本通常由不同的语义区缺组合而成,定位和挖掘这类区块对网页内容理解、页面结构分析等有着重要的作用.然而由于不同网页在结构和内容上都存在着较大的区别,准确的从不同的网页中定位特定的结构区域是一个相对复杂的任务.主要提出一种基于树匹配的方法用来挖掘网页中的语义区块,并通过剪枝等策略优化算法.实验表明该方法能有效提高F值,同时算法的性能有较大改善.

关 键 词:编辑距离  树匹配  数据挖掘  剪枝

Algorithm for Webpage Semantic Blocks Mining Using Tree Match Method
LIU Shou-qun,ZHU Ming,TAN Xiao-bin.Algorithm for Webpage Semantic Blocks Mining Using Tree Match Method[J].Mini-micro Systems,2009,30(8).
Authors:LIU Shou-qun  ZHU Ming  TAN Xiao-bin
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号