首页 | 本学科首页   官方微博 | 高级检索  
     

一种多分类器Deep Web数据源的自动分类与判别方法
引用本文:李志涛,刘全,周文云.一种多分类器Deep Web数据源的自动分类与判别方法[J].计算机应用与软件,2010,27(2):11-13,70.
作者姓名:李志涛  刘全  周文云
作者单位:1. 苏州大学计算机科学与技术学院,江苏,苏州,215006
2. 苏州大学计算机科学与技术学院,江苏,苏州,215006;南京大学计算机软件新技术国家重点实验室,江苏,南京,210093
基金项目:国家自然科学基金项目(60673092,60775046,60873116);;教育部科学技术研究重点项目(207040);;中国博士后科研基金项目(20060390919);;江苏省自然科学基金项目(BK2008161);;江苏省高校自然科学基金(06KJB520104)
摘    要:Deep Web数据源的发现和其领域相关性越来越引起人们的关注和兴趣。针对在判别查询接口时,提取精度低和忽略领域相关性的问题,提出一种采用多分类器对Deep Web数据源进行自动分类和判别的方法,其思想是:对爬虫获取到的页面使用朴素贝叶斯分类器对其进行领域相关性分类,然后使用改进的决策树分类器来对特定领域的数据源进行判定。实验结果表明此方法相比于使用单一决策树分类器有更好的性能,其召回率和精度都有所提高。

关 键 词:深网  网页表单  朴素贝叶斯分类  决策树

A METHOD TO AUTOMATICALLY CLASSIFY AND DISCRIMINATE DEEP WEB DATA SOURCE USING MULTI-CLASSIFIER
Li Zhitao,Liu Quan,Zhou Wenyun.A METHOD TO AUTOMATICALLY CLASSIFY AND DISCRIMINATE DEEP WEB DATA SOURCE USING MULTI-CLASSIFIER[J].Computer Applications and Software,2010,27(2):11-13,70.
Authors:Li Zhitao  Liu Quan  Zhou Wenyun
Affiliation:College of Computer Science and Technology/a>;Soochow University/a>;Suzhou 215006/a>;Jiangsu/a>;China;State Key Laboratory for Novel Software Technology/a>;Nanjing University/a>;Nanjing 210093/a>;China
Abstract:
Keywords:
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号