首页 | 本学科首页   官方微博 | 高级检索  
     

动态调整的Web文档增量聚类算法
引用本文:闵可锐,唐悦,胡运发,赵泽宇,闫华. 动态调整的Web文档增量聚类算法[J]. 计算机辅助工程, 2006, 15(3): 110-113
作者姓名:闵可锐  唐悦  胡运发  赵泽宇  闫华
作者单位:复旦大学计算机科学与工程系,上海,200433;复旦大学信息化办公室,上海,200433
摘    要:介绍Web文档聚类的应用,针对现有文档聚类算法缺乏动态更新能力、经验参数过多以及缺乏对新词的把握等不足,提出动态调整的Web文档增量聚类(Dynamically Adjusted Incremental Web Document Clustering,DAIWDC)算法,并使用同义词词林优化结果.该算法在实验中达到了88%的正确率和75%的全面率,表明其具有较高的实用价值.

关 键 词:增量算法  文档聚类  同义词词林
文章编号:1006-0871(2006)03-0110-04
收稿时间:2006-06-06
修稿时间:2006-06-06

Dynamically adjusted incremental Web document clustering algorithm
MIN Kerui,TANG Yue,HU Yunfa,ZHAO Zeyu,YAN Hua. Dynamically adjusted incremental Web document clustering algorithm[J]. Computer Aided Engineering, 2006, 15(3): 110-113
Authors:MIN Kerui  TANG Yue  HU Yunfa  ZHAO Zeyu  YAN Hua
Abstract:The application of Web-based document clustering is introduced. With the deficiency such as lack of dynamic update ability, too many empirical parameters, being short of handling new words, an algorithm, dynamically adjusted incremental Web document clustering (DAIWDC) is proposed. And CiLin is introduced to optimize the result. The experiment shows that it can improve the precision to 88% and recall to 75% and can be well used in practice.
Keywords:incremental algorithm    document clustering   CiLin
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号