首页 | 本学科首页   官方微博 | 高级检索  
     

基于主题词匹配频数的搜索引擎结果聚类算法
引用本文:胡诗未,李晓峰,徐伟.基于主题词匹配频数的搜索引擎结果聚类算法[J].计算机工程与科学,2011,33(6):130.
作者姓名:胡诗未  李晓峰  徐伟
作者单位:四川大学计算机学院,四川成都,610064
摘    要:搜索引擎结果聚类对提高搜索引擎服务质量和智能化水平有较高的应用价值,它是从标题和文档片段的有限信息中寻找文档相关度进行聚类。传统搜索引擎聚类没有充分利用搜索引擎结果的自身特点,或者计算复杂度较高。本文提出了一种基于主题词匹配频数的搜索引擎聚类算法,该算法从高频词中筛选出主题词,根据主题词共现情况自动产生类别,其他结果依据满足与类别主题词表的匹配频数的文档数进行聚类。实验结果与STC和LINGO算法相比,搜索质量有所提高。

关 键 词:搜索结果聚类  词间语义相关度  文档相似度  主题词

An Algorithm for the Search Results Clustering Based on Topic Words Matching Frequency
HU Shi-wei,LI Xiao-feng,X Wei.An Algorithm for the Search Results Clustering Based on Topic Words Matching Frequency[J].Computer Engineering & Science,2011,33(6):130.
Authors:HU Shi-wei  LI Xiao-feng  X Wei
Affiliation:HU Shi-wei,LI Xiao-feng,X(U) Wei
Abstract:Search engine results clustering has a high application value to the search service quality and the intelligence level,which clusters by seeking the document relations from the title and the document segment information.An algorithm based on topic words matching frequency is proposed.It automatically generate categories according to the graph of the semantic relevance,with other results clustering by topic words matching frequency.Experiments show that,compared with the STC and LINGO algorithms,the algorithm performs better.
Keywords:search results clustering  semantic relevance between words  document similarity  topic word
本文献已被 万方数据 等数据库收录!
点击此处可从《计算机工程与科学》浏览原始摘要信息
点击此处可从《计算机工程与科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号