首页 | 本学科首页   官方微博 | 高级检索  
     

机器学习与网络信息处理
引用本文:李嘉佑,何清,史忠植. 机器学习与网络信息处理[J]. 计算机工程与应用, 2004, 40(33): 189-191
作者姓名:李嘉佑  何清  史忠植
作者单位:中国科技大学,合肥,230027;中国科学院计算技术研究所智能信息处理重点实验室,北京,100080;中国科学院计算技术研究所智能信息处理重点实验室,北京,100080
基金项目:国家自然基金(编号:90104021,60173017,60073019),北京市重点自然科学基金(编号:4011003)资助
摘    要:
机器学习在网络信息处理中占有重要地位。GHunt是一个采用多项机器学习技术的网络信息智能获取与处理系统。首先,这一系统支持分布式的网络信息并行搜索与内容过滤;其次,采用机器学习技术,包括文本分类、聚类,文本概念抽取,从概念层次理解文本信息;再次,基于概念语义空间有效地统一文本信息管理;最后提供高效的基于概念语义的文本信息检索,以及个性化的专题组织与信息推送服务。文中着重阐述了系统中所用到的机器学习技术。

关 键 词:网络信息  机器学习  概念语义空间  分类  聚类
文章编号:1002-8331-(2004)33-0189-03

Machine Learning and Web Information Processing
Li Jiayou , He Qing Shi Zhongzhi. Machine Learning and Web Information Processing[J]. Computer Engineering and Applications, 2004, 40(33): 189-191
Authors:Li Jiayou    He Qing Shi Zhongzhi
Affiliation:Li Jiayou 1,2 He Qing 2 Shi Zhongzhi 21
Abstract:
Machine Learning plays an important role in processing web information.GHunt is an intelligent system based on machine learning for web information acquiring and processing.Firstly,the system supports distributed parallel searching and filtering web information.Secondly,the system can distinguish the domain of the web page and understand the document at the concept level by text classification,clustering and concept extraction based machine learning.Thirdly,the system can manage the documents based on semantic concept space.At last,the system can efficiently provide text retrieve based on semantics and individual recommendation for news event.In the paper the machine learning technology applied in the system are described in detail.
Keywords:Web Information  machine learning  semantic concept space  classification  clustering
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号