首页 | 本学科首页   官方微博 | 高级检索  
     

RT-Rank:基于RSS标签排名相关性的文档聚类
引用本文:王波,唐常杰,段磊,尹佳,左劼,李川.RT-Rank:基于RSS标签排名相关性的文档聚类[J].计算机研究与发展,2007,44(Z3):125-130.
作者姓名:王波  唐常杰  段磊  尹佳  左劼  李川
作者单位:四川大学计算机学院,成都,610065
基金项目:国家自然科学基金 , 高等学校博士学科点专项科研项目
摘    要:RSS文档聚合是Web 2.0的特色技术,目前RSS相关性阅读还仅限于简单的相同标签聚合.为解决此问题,提出了基于RSS标签聚类的新方法,主要工作包括:1)分析传统RSS聚合方法的不足之处;2)提出了RSS标签排名的概念和计算方法,将标签计数转化为了标签排名,消除了部分噪音;3)提出标签比重积累的RSS标签排名的Hash聚类方法;4)做了详实的实验.实验表明,新的RSS相关性文档聚类方法准确度提高了7%.

关 键 词:数据挖掘  聚类  RSS  标签排名  标签  相关性  文档聚类  Correlation  Rank  Based  Clustering  实验  聚类方法  Hash  积累  噪音  转化  计数  计算方法  聚合方法  分析  工作包  问题  阅读
修稿时间:2007年7月5日

RT-Rank: Document Clustering Based on RSS Tag Rank Correlation
Wang Bo,Tang Changjie,Duan Lei,Yin Jia,Zuo Jie,Li Chuan.RT-Rank: Document Clustering Based on RSS Tag Rank Correlation[J].Journal of Computer Research and Development,2007,44(Z3):125-130.
Authors:Wang Bo  Tang Changjie  Duan Lei  Yin Jia  Zuo Jie  Li Chuan
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号