首页 | 本学科首页   官方微博 | 高级检索  
     

基于CCIPCA和ICA降维的文本分类研究
引用本文:何海斌,李新福,赵蕾蕾. 基于CCIPCA和ICA降维的文本分类研究[J]. 计算机工程与应用, 2008, 44(29): 150-152. DOI: 10.3778/j.issn.1002-8331.2008.29.042
作者姓名:何海斌  李新福  赵蕾蕾
作者单位:河北大学,数学与计算机学院,河北,保定,071002;河北大学,数学与计算机学院,河北,保定,071002;河北大学,数学与计算机学院,河北,保定,071002
基金项目:国家自然科学基金,河北省自然科学基金,河北省教育厅科研项目
摘    要:文本分类中采用向量空间模型来表达文本特征,维数巨大,关键是对高维的特征集进行降维处理,而一般的分解算法无法处理大规模的高维问题。采用CCIPCA与ICA相结合的特征提取方法可以有效地实现文本特征降维。实验结果表明降维提高了分类器的效率和效果。

关 键 词:文本分类  特征降维  直观无协方差增量主元分析  独立成分分析  支持向量机
收稿时间:2008-04-23
修稿时间:2008-7-21 

Research of text categorization based on CCIPCA and ICA
HE Hai-bin,LI Xin-fu,ZHAO Lei-lei. Research of text categorization based on CCIPCA and ICA[J]. Computer Engineering and Applications, 2008, 44(29): 150-152. DOI: 10.3778/j.issn.1002-8331.2008.29.042
Authors:HE Hai-bin  LI Xin-fu  ZHAO Lei-lei
Affiliation:Faculty of Mathematics and Computer Science,Hebei University,Baoding,Hebei 071002,China
Abstract:Vector Space Model is usually used to express text for text categorization.The process of dimension reduction is a very key problem for practical text categorization.The classical decomposition algorithms are incapable of solving these problems with high-dimensional and large-scale.In this paper an approach to reduce dimensionality of feature space is presented by using candid incremental principal component analysis and independent component analysis algorithm.The experimental result shows that the proposed method for dimension reduction is feasible and effective.
Keywords:text categorization  dimension reduction  Candid Covariance-free Incremental Principal Component Analysis(CCIPCA)  Independent Components Analysis(ICA)  Support Vector Machine(SVM)
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《计算机工程与应用》浏览原始摘要信息
点击此处可从《计算机工程与应用》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号