首页 | 本学科首页   官方微博 | 高级检索  
     

基于超链接信息的搜索引擎检索结果聚类方法研究
引用本文:夏斌,徐彬. 基于超链接信息的搜索引擎检索结果聚类方法研究[J]. 电脑开发与应用, 2007, 20(5): 16-17,20
作者姓名:夏斌  徐彬
作者单位:河南大学计算机信息工程学院,开封475001;河南大学计算机信息工程学院,开封475001
摘    要:针对目前搜索引擎返回候选信息过多从而使用户不能准确查找与主题有关结果的问题,提出了基于超链接信息的搜索引擎检索结果聚类方法,通过对网页的超链接锚文档和网页文档内容挖掘,最终将网页聚成不同的子类别。这种方法在依据网页内容进行聚类的同时,充分利用了Web结构和超链接信息,比传统的结构挖掘方法更能体现网站文档的内容特点,从而提高了聚类的准确性。

关 键 词:搜索引擎  超链接  结构挖掘  聚类
文章编号:1003-5850(2007)05-0016-03
收稿时间:2006-11-29
修稿时间:2006-11-292007-02-26

Research Clustering the Searching Results of Search Engines based on Hyperlink
Xia Bin. Research Clustering the Searching Results of Search Engines based on Hyperlink[J]. Computer Development & Applications, 2007, 20(5): 16-17,20
Authors:Xia Bin
Abstract:As for the problem that users spend much time to select the results from that returned from search engine and can not get the exact one, this paper presents a new approach for clustering the search engine searching results based on hyperlink information. Through mining the hyperlink anchor file of web page ,this method clusters the web page into the different little kinds, in which the contents of web page are clustered and Web structure and hyperlink information are made a best use,giving a more characteristics of Web document contents than the traditional structure mining method and improving the veracity of clustering.
Keywords:search engines   hyperlink   structure mining   clustering
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号