首页 | 官方网站   微博 | 高级检索  
     

语义相似的PageRank改进算法
引用本文:何明,周军,李树友.语义相似的PageRank改进算法[J].计算机工程与应用,2009,45(27):140-142.
作者姓名:何明  周军  李树友
作者单位:1.辽宁工业大学 电子与信息工程学院,辽宁 锦州 121000 2.辽宁工业大学 数理科学系,辽宁 锦州 121000
基金项目:辽宁省教育厅科学研究基金,辽宁省高校优秀青年骨干教师基金 
摘    要:PageRank算法是一种用于网页排序的算法,它利用网页间的相互引用关系评价网页的重要性。但由于它只考虑网页与网页之间的链接结构,忽略了网页与主题的相关性,容易造成主题漂移现象。在分析了原PageRank算法基础上,给出了一种基于语义相似度的PageRank改进算法。该算法能够按照网页结构和网页主要内容计算出网页的PageRank值,既不会增加算法的时空复杂度,又极大地减少了“主题漂移”现象,从而提高查询效率和质量。

关 键 词:PageRank算法  主题漂移  语义相似度  
收稿时间:2008-11-3
修稿时间:2009-1-19  

New semantic similarity PageRank algorithm
HE Ming,ZHOU Jun,LI Shu-you.New semantic similarity PageRank algorithm[J].Computer Engineering and Applications,2009,45(27):140-142.
Authors:HE Ming  ZHOU Jun  LI Shu-you
Affiliation:1.College of Electronic and Information Engineering,Liaoning University of Technology,Jinzhou,Liaoning 121000,China 2.Department of Mathematical Science,Liaoning University of Technology,Jinzhou,Liaoning 121000,China
Abstract:The PageRank algorithm is used in ranking web pages.It estimates the pages’ authority by taking into account the link web structure.However,it only considers the structure of webs’ link,without any topic about webs,so this algorithm leads to topic-drift.After analyzing the original PageRank algorithm several times,an improved PageRank algorithm based on semantic similarity is proposed.This new PageRank algorithm can calculate the PageRank’s value according to the structure and content about web,it can avoid the topic-drift problem and improve the quality of web search effectively without adding any other extra time and space complexity degree.
Keywords:PageRank algorithm  topic-drift  semantic similarity
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程与应用》浏览原始摘要信息
点击此处可从《计算机工程与应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号