首页 | 本学科首页   官方微博 | 高级检索  
     

面向Web信息检索的虚核文本分类算法
引用本文:李静,杨小帆,孙启干.面向Web信息检索的虚核文本分类算法[J].计算机工程,2012,38(10):182-184.
作者姓名:李静  杨小帆  孙启干
作者单位:重庆大学计算机学院,重庆,400044
基金项目:重庆市自然科学基金资助项目(CSTC2010BB2046);中央高校研究生科研创新基金资助项目(CDJXS11181164)
摘    要:提出一种虚核文本分类算法。通过单类别下标记数据的特征词频计算该类别虚核在每个特征项处的特征引力场强,进而获得类别虚核,根据类别虚核对待标记文本产生的引力大小判断其所属类别。实验结果表明,与k近邻算法和朴素贝叶斯算法相比,虚核算法在分类精度和时间开销方面具有较大的优势。

关 键 词:信息检索  文本分类  特征选择  向量空间模型  引力场模型  虚核
收稿时间:2011-07-19

Virtual Kernel Text Categorization Algorithm for Web Information Retrieval
LI Jing , YANG Xiao-fan , SUN Qi-gan.Virtual Kernel Text Categorization Algorithm for Web Information Retrieval[J].Computer Engineering,2012,38(10):182-184.
Authors:LI Jing  YANG Xiao-fan  SUN Qi-gan
Affiliation:(College of Computer Science,Chongqing University,Chongqing 400044,China)
Abstract:This paper proposes a novel Virtual Kernel(VK) text categorization algorithm.It obtains a virtual kernel for each categorize through evaluating the contribution of each feature term.When an unlabeled text comes,the algorithm can give the categorize it belongs to through evaluating the attraction which is from every virtual kernel.Experimental results show that compared with the k Nearest Neighbor(kNN) and na ve Bayes algorithms,the proposed algorithm is remarkably superior to them in terms of classification efficiency and time cost.
Keywords:information retrieval  text categorization  feature selection  vector space model  attraction field model  Virtual Kernel(VK)
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程》浏览原始摘要信息
点击此处可从《计算机工程》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号