首页 | 本学科首页   官方微博 | 高级检索  
     

基于网页结构挖掘算法研究
引用本文:张泊平,郭超峰.基于网页结构挖掘算法研究[J].计算机与信息技术,2006(6).
作者姓名:张泊平  郭超峰
作者单位:许昌学院计算机科学与技术学院,许昌学院计算机科学与技术学院 许昌461000,驻马店教育学院,驻马店463000,许昌461000
基金项目:国家自然科学基金资助项目,项目编号60475040,河南省科技攻关项目,项目编号0524220054
摘    要:Web页面包含了丰富的、动态的超链信息,挖掘超链及其周围的文档可以帮助用户找到感兴趣的、权威的内容。主要论述了基于超链的Web结构挖掘的方法,并对Web结构挖掘的一般方法HITS算法进行改进。采用这种改进算法,可以从任意页面集中计算出具有最大Authority权值和Hub权值的页面。从而把一个可信度的、权威的网站推荐给用户。

关 键 词:网页结构  超链  挖掘  算法
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号