首页 | 本学科首页   官方微博 | 高级检索  
     

一种改进的页面相似性度量方法
引用本文:张霞,王建东,顾海花.一种改进的页面相似性度量方法[J].计算机工程与应用,2010,46(19):141-144.
作者姓名:张霞  王建东  顾海花
作者单位:1. 南京信息职业技术学院,软件学院,南京,210046
2. 南京航空航天大学,信息科学与技术学院,南京,210016
基金项目:江苏省高校自然科学基金资助项目 
摘    要:Web 信息检索是指从大量Web 文档集合中找到与给定的查询请求相关的、恰当数目的文档子集。为了更准确地找到相似文档,借助于两个页面的单词覆盖程度,提出一种改进的Web 页面检索度量方法,并在KNN分类实验中得到验证。

关 键 词:Web  页面检索  相似性  文本分类
收稿时间:2008-12-24
修稿时间:2009-3-2  

Improvement of similarity measure method
ZHANG Xia,WANG Jian-dong,GU Hai-hua.Improvement of similarity measure method[J].Computer Engineering and Applications,2010,46(19):141-144.
Authors:ZHANG Xia  WANG Jian-dong  GU Hai-hua
Affiliation:1.Software College,Nanjing College of Information Technology,Nanjing 210046,China 2.College of Information Science and Technology,Nanjing University of Aeronautics and Astronautics,Nanjing 210016,China
Abstract:Web information retrieval is focus on how to search out the documents subset from a large collection of documents,which is relevant to the users'query.In order to find the similar documents,this paper presents an improved method on measure methods of web information retrieval,and it is verified in KNN classifiers.
Keywords:web page retrieval  similarity  text classification
本文献已被 维普 万方数据 等数据库收录!
点击此处可从《计算机工程与应用》浏览原始摘要信息
点击此处可从《计算机工程与应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号