首页 | 本学科首页   官方微博 | 高级检索  
     

基于Web的智能信息采集及处理系统设计与实现
引用本文:张 帆,李琳娜,杨炳儒.基于Web的智能信息采集及处理系统设计与实现[J].计算机工程,2007,33(18):265-267.
作者姓名:张 帆  李琳娜  杨炳儒
作者单位:北京科技大学信息工程学院 北京100083
基金项目:教育部科技基金 , 北京市自然科学基金
摘    要:互联网信息日益扩展的同时,如何采集和利用Web信息越来越备受关注。该文设计和实现的基于Web的智能信息采集及处理系统,采用高效的URL去重和基于模版的下载机制,提高了采集Web资源的性能;应用自然语言处理技术,对采集信息做智能分类和摘要,在发布上突出个性化的信息服务。与同类系统相比,智能性、实用性都显示出了明显的优势。

关 键 词:Web采集  URL去重  智能信息处理  个性化发布
文章编号:1000-3428(2007)18-0265-03
修稿时间:2006-10-08

Design and Implementation of Intelligent Information Collection and Processing System Based on Web
ZHANG Fan,LI Lin-na,YANG Bing-ru.Design and Implementation of Intelligent Information Collection and Processing System Based on Web[J].Computer Engineering,2007,33(18):265-267.
Authors:ZHANG Fan  LI Lin-na  YANG Bing-ru
Affiliation:School of Information and Engineering, University of Science and Technology Beijing, Beijing 100083
Abstract:With the rapid development of Internet,collecting and exploiting Web information is extensively addressed.This paper designs and realizes one intelligent system on Web information collection and processing.On one hand,thanks to unrepreated URLs and template-based downloading,the collection performance is improved greatly.On the other hand,mature and advanced natural language processing techniques are used for classifying and abstracting the collected information.Thus,the personalization is highlighted.Experimental results show that the proposed system outperforms related work greatly.
Keywords:Web collection  unrepreated URL  intelligent information processing  personal issue
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程》浏览原始摘要信息
点击此处可从《计算机工程》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号