首页 | 本学科首页   官方微博 | 高级检索  
     

一种高效的Web新闻发表时间提取方法
引用本文:仲兆满,李存华,乔磊,张文艳,管燕.一种高效的Web新闻发表时间提取方法[J].小型微型计算机系统,2013,34(9).
作者姓名:仲兆满  李存华  乔磊  张文艳  管燕
作者单位:1. 淮海工学院计算机工程学院,江苏连云港,222005
2. 淮海工学院计算机工程学院,江苏连云港222005;中国矿业大学计算机科学与技术学院,江苏徐州221116
基金项目:国家自然科学基金项目,连云港市科技攻关项目
摘    要:Web网页的发表时间在Web搜索中起到重要的作用,因为用户获取的结果往往是与时间密切相关的.本文围绕Web新闻发表时间的提取,提出了一种高效的Web新闻发表时间提取方法.该方法考虑到了Web新闻网页URL地址隐含时间信息的特性,信息发表时间与新闻标题的距离约束.在主流的7个中文搜索引擎,使用了30个关键字,共获取3827篇Web新闻信息进行了提取时间的准确率及时间消耗的实验分析与比较,结果显示本文提出方法的准确率为95.5%,时间消耗为88秒.

关 键 词:信息抽取  发表时间抽取  Web新闻  高效方法

An Efficient Method of Publication Time Extraction for Web News
ZHONG Zhao-man , LI Cun-hua , QIAO Lei , ZHANG Wen-yan , GUAN Yan.An Efficient Method of Publication Time Extraction for Web News[J].Mini-micro Systems,2013,34(9).
Authors:ZHONG Zhao-man  LI Cun-hua  QIAO Lei  ZHANG Wen-yan  GUAN Yan
Abstract:
Keywords:information extraction  publication time extraction  Web news  efficient method
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号