首页 | 本学科首页   官方微博 | 高级检索  
     

基于加权向量空间模型的网络搜索*
引用本文:白曦,吕晓枫,孙吉贵.基于加权向量空间模型的网络搜索*[J].计算机应用研究,2007,24(2):51-53.
作者姓名:白曦  吕晓枫  孙吉贵
作者单位:吉林大学,计算机科学与技术学院,计算机教学中心,吉林,长春,130012
基金项目:国家自然科学基金 , 吉林省科技发展计划
摘    要:为了高效地对从Internet上获取的文档进行训练并归类,给出了一种新的分类器模型.该模型在传统的向量空间模型(VSM)中引入了关键词语的加权因子,并在训练文档过程中对文档类型特征向量进行动态优化.这在一定程度上恢复了关键词语实际应具有的权值,方便了阈值的选取,使分类更加准确和高效.实验表明,该分类器分类合理、分类准确性有明显的提高,并具有一定的学习功能.

关 键 词:向量空间模型  自动分类  加权因子  调节系数  阈值  加权向量  空间模型  网络搜索  Vector  Space  Model  Weighted  Based  Search  学习功能  分类准确性  实验  选取  阈值  权值  恢复  程度  动态优化  特征向量  文档类型  文档过程  加权因子
文章编号:1001-3695(2007)02-0051-03
修稿时间:2005-11-152005-12-29

Network Search Based on Weighted Vector Space Model
BAI Xi,LV Xiao feng,SUN Ji gui.Network Search Based on Weighted Vector Space Model[J].Application Research of Computers,2007,24(2):51-53.
Authors:BAI Xi  LV Xiao feng  SUN Ji gui
Affiliation:(Center of Computing, College of Computer Science & Technology, Jilin University, Changchun Jilin 130012, China)
Abstract:In order to train and categorize the articles more efficiently, which are obtained from Internet, this paper gives a new model of a classifier. This model applies the weighted factors of keywords on traditional Vector Space Model(VSM) and optimizes the characteristic vectors of articles when they have been trained. It can repair the weighted values of keywords and make the selection of the threshold value more convenient. The tests prove that this classifier which can categorize articles reasonably and more precisely also has the learning capacity.
Keywords:Vector Space Model(VSM)  Automatic Categorization  Weighted Factor  Poundage Factor  Threshold Value
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机应用研究》浏览原始摘要信息
点击此处可从《计算机应用研究》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号