首页 | 本学科首页   官方微博 | 高级检索  
     

基于正交分解的文本分类模型
引用本文:熊忠阳,李智星,张玉芳,江帆. 基于正交分解的文本分类模型[J]. 计算机工程, 2009, 35(14): 227-229
作者姓名:熊忠阳  李智星  张玉芳  江帆
作者单位:重庆大学计算机学院,重庆,400030
基金项目:教育部留学回国人员科研启动基金 
摘    要:针对文本分类领域中向量空间模型维数过高和空间扭曲的问题,提出一种基于正交分解的新模型。借用物理学中力的正交分解,将高维的文本向量映射到低维的以类别为坐标轴的空间中,解决了高维的向量和扭曲的空间这2个问题。实验表明,与向量空间模型相比,新模型下分类速度有较大提高,精度也有所增加。

关 键 词:文本分类  正交分解  向量空间模型
修稿时间: 

Text Classification Model Based on Orthogonal Decomposition
XIONG Zhong-yang,LI Zhi-xing,ZHANG Yu-fang,JIANG Fan. Text Classification Model Based on Orthogonal Decomposition[J]. Computer Engineering, 2009, 35(14): 227-229
Authors:XIONG Zhong-yang  LI Zhi-xing  ZHANG Yu-fang  JIANG Fan
Affiliation:School of Computer;Chongqing University;Chongqing 400030
Abstract:In text classification area,Vector Space Model(VSM) is the most widely used model while it has two drawbacks:high dimensions and warped space.This paper presents a new model based on orthogonal decomposition.In this model,higher dimensional vectors of texts are mapped in a lower dimensional space which uses categories as its coordinate axes to solve these two drawbacks.Experiment shows that under the new model,the classification process is speeded up to a considerable degree and the precision is increased.
Keywords:text classification  orthogonal decomposition  Vector Space Model(VSM)
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程》浏览原始摘要信息
点击此处可从《计算机工程》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号