首页 | 本学科首页   官方微博 | 高级检索  
     

单路径层次化网页分类算法
引用本文:彭小刚,傅向华.单路径层次化网页分类算法[J].计算机工程与设计,2008,29(9):2356-2359.
作者姓名:彭小刚  傅向华
作者单位:深圳大学信息工程学院(软件学院),广东,深圳,518060
基金项目:国家自然科学基金 , 深圳大学校科研和教改项目
摘    要:网页自动分类是解决互联网信息检索困难的有效方法.虽然有很多自动分类算法和系统,但是大部分此类算法注重如何将网页准确分到某个独立的类别里面,却忽略类别之间所组成的体系结构本身也具备的一些隐藏分类信息.同时,一般的分类算法每次分类都需要搜索所有的类别.针对这些缺点,提出了一种基于结构的单路径层次化网页分类算法,该分类方法利用类别之间具有树状结构这一特点,对类别中存在父子关系的类别间进行信息传递,使得每次分类只需要搜索树中一条路径而不用遍历所有树节点.实验结果证明,这种单路径搜索技术与相关的算法相比,在减少搜索节点的同时可以提高6%的准确度.

关 键 词:网页分类  层次结构  信息提取  单路径  类别信息树  特征传递
文章编号:1000-7024(2008)09-2356-03
修稿时间:2007年6月5日

Algorithm on hierarchical classification of single-path webpages
PENG Xiao-gang,FU Xiang-hua.Algorithm on hierarchical classification of single-path webpages[J].Computer Engineering and Design,2008,29(9):2356-2359.
Authors:PENG Xiao-gang  FU Xiang-hua
Affiliation:PENG Xiao-gang,FU Xiang-hua(College of Information Engineering,Shenzhen University,Shenzhen 518060,China)
Abstract:Automatic classification of web pages is an effective way to deal with the difficulty of retrieving information from the Internet.Although there are many automatic classification algorithms and systems that have been proposed,most of them focus on how to classified webpage into categories correctly yet ignore the category hierarchy also provides some useful information for classification.They also require searching through all existing categories to make any classification.A single-path hierarchical classif...
Keywords:webpage classification  hierarchical classification  information retrieval  single-path  category information tree  feature propagation  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号