首页 | 本学科首页   官方微博 | 高级检索  
     

基于路径学习的信息自动抽取方法
引用本文:于琨,蔡智,糜仲春,蔡庆生. 基于路径学习的信息自动抽取方法[J]. 小型微型计算机系统, 2003, 24(12): 2147-2149
作者姓名:于琨  蔡智  糜仲春  蔡庆生
作者单位:1. 中国科学技术大学,计算机科学技术系,安徽,合肥,230027
2. 中国科学技术大学,信息管理与决策科学系,安徽,合肥,230026
基金项目:国家自然科学基金项目 (70 1 71 0 52、60 0 750 1 5)资助
摘    要:针对用户需求的网页信息自动抽取是解决互联网信息爆炸问题的一个有效途径 ,然而现有的信息自动抽取方法均难以同时满足网页信息自动抽取中查全率与查准率高、抽取速度快、抽取信息量大和用户负担轻的要求 .本文提出了一种基于路径学习的信息自动抽取方法 ,并采用该方法编制了一个商品价格信息自动抽取系统 .实验结果表明 ,该方法具有用户负担较轻 (只需用户提供 2~ 4个学习实例 )、查全率 (97.0 4~ 10 0 % )与查准率 (99~ 10 0 % )高、可实现大样本量信息抽取和时间资源耗费少 (抽取时间 <1秒 )等特点 ,能基本满足网页信息自动抽取的要求 .

关 键 词:信息自动抽取 路径学习 互联网 网页结构分析 归纳学习
文章编号:1000-1220(2003)12-2147-03

Information Retrieval Method Based on Path Learning
YU Kun ,CAI Zhi ,MI Zhong -chun ,CAI Qing -sheng. Information Retrieval Method Based on Path Learning[J]. Mini-micro Systems, 2003, 24(12): 2147-2149
Authors:YU Kun   CAI Zhi   MI Zhong -chun   CAI Qing -sheng
Affiliation:YU Kun 1,CAI Zhi 2,MI Zhong -chun 1,CAI Qing -sheng 2 1
Abstract:
Keywords:information retrieval  path learning  Internet  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号