首页 | 本学科首页   官方微博 | 高级检索  
     

一种有效的深网入口识别方法
引用本文:吴春明,谢德体.一种有效的深网入口识别方法[J].计算机科学与探索,2011,38(10).
作者姓名:吴春明  谢德体
作者单位:1. 西南大学计算机与信息科学学院 重庆 400715;西南大学资源环境学院 重庆 400715
2. 西南大学资源环境学院 重庆 400715
摘    要:深网入口自动识别是深网数据集成的前提和基础.由于表单在设计上具有较大的随意性,使得深网入口缺乏统一的构建标准,难以利用确定性的规则对其进行判断.首先基于统计特征,抽取了部分表单属性作为深网入口与非深网入口的可区分特征,在此基础上,提出了一种利用神经网络进行深网入口自动识别的方法.不同于基于规则的判断方法,神经网络是被训练的,不需要任何先验知识,这种特性使其非常适合于对具有复杂表现形式的深网入口进行判定.实验结果表明了该方法的有效性.

关 键 词:深网入口  神经网络  特征抽取  机器学习

Effective Approach to Deep Web Entries Identification
WU Chun-ming,XIE De-ti.Effective Approach to Deep Web Entries Identification[J].Journal of Frontier of Computer Science and Technology,2011,38(10).
Authors:WU Chun-ming  XIE De-ti
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号