基于网页结构挖掘算法研究 |
| |
引用本文: | 张泊平,郭超峰.基于网页结构挖掘算法研究[J].计算机与信息技术,2006(6). |
| |
作者姓名: | 张泊平 郭超峰 |
| |
作者单位: | 许昌学院计算机科学与技术学院,许昌学院计算机科学与技术学院 许昌461000,驻马店教育学院,驻马店463000,许昌461000 |
| |
基金项目: | 国家自然科学基金资助项目,项目编号60475040,河南省科技攻关项目,项目编号0524220054 |
| |
摘 要: | Web页面包含了丰富的、动态的超链信息,挖掘超链及其周围的文档可以帮助用户找到感兴趣的、权威的内容。主要论述了基于超链的Web结构挖掘的方法,并对Web结构挖掘的一般方法HITS算法进行改进。采用这种改进算法,可以从任意页面集中计算出具有最大Authority权值和Hub权值的页面。从而把一个可信度的、权威的网站推荐给用户。
|
关 键 词: | 网页结构 超链 挖掘 算法 |
本文献已被 CNKI 等数据库收录! |
|