首页 | 本学科首页   官方微博 | 高级检索  
     

搜索引擎结果聚类算法研究
引用本文:张健沛,刘洋,杨静,代坤.搜索引擎结果聚类算法研究[J].计算机工程,2004,30(5):95-97.
作者姓名:张健沛  刘洋  杨静  代坤
作者单位:1. 哈尔滨工程大学计算机科学与技术学院,哈尔滨150001
2. 中国科学院研究生院,北京100080
基金项目:黑龙江省自然科学基金资助项目(F01-06)
摘    要:随着Web文档数量的剧增,搜索引擎也暴露了许多问题,用户不得不在搜索引擎返回的大量文档摘要列表中查找。而对搜索引擎结果聚类能使用户在更高的主题层次上来查看搜索引擎返回的结果。该文提出了搜索引擎结果聚类的几个重要指标并给出了一个新的基于PAT—tree的搜索引擎结果聚类算法。

关 键 词:聚类  搜索引擎  PAT—tree  Web内容挖掘
文章编号:1000-3428(2004)05-0095-03

Research on Clustering Algorithms for Search Engine Results
ZHANG Jianpei,LIU Yang,YANG Jing,DAI Kun.Research on Clustering Algorithms for Search Engine Results[J].Computer Engineering,2004,30(5):95-97.
Authors:ZHANG Jianpei  LIU Yang  YANG Jing  DAI Kun
Affiliation:ZHANG Jianpei1,LIU Yang1,YANG Jing1,DAI Kun2
Abstract:Web search engines have become increasingly ineffective as the number of document on the Web is proliferated. Users of Web search engines are often forced to shift through the long ordered list of document "snippets" returned by the engines. Clustering search engine results help users more quickly and efficiently to navigate the results of a query at a more topical level. The paper articulates the key requirements for document clustering of search engine results and proposes a PAT-tree-based approach to cluster Chinese search engine results.
Keywords:Clustering  Search engine  PAT-tree  Web content mining  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号