首页 | 本学科首页   官方微博 | 高级检索  
     

基于主成分分析的自动文本分类模型研究
引用本文:张锦,李光,曹伍,胡瑞芬. 基于主成分分析的自动文本分类模型研究[J]. 北京邮电大学学报, 2006, 29(Z2): 136-138
作者姓名:张锦  李光  曹伍  胡瑞芬
作者单位:1. 浙江大学 生物医学工程系, 杭州 310027; 2. 湖南大学 软件学院, 长沙 410082; 3. 浙江大学 工业控制技术国家重点实验室, 杭州 310027; 4. 纽约州立大学Postdam分校 教育学院, 纽约, 美国
基金项目:国家自然科学基金,国家重点基础研究发展计划(973计划),湖南省自然科学基金
摘    要:提出了一种基于BP神经网络和主成分分析的文本分类模型。该模型利用主成分分析实现对特征矩阵的降维,通过大量的模拟实验逐步优化BP网络的各项参数。在20_newgroups数据集上的模拟实验表明,该模型具有较好的性能并能得到较高的分类精度。

关 键 词:文本分类  反向传播神经网络  主成分分析
文章编号:1007-5321(2006)增-0136-03
收稿时间:2006-09-27
修稿时间:2006-09-27

Research on Auto Text Classification Model Based on PCA
ZHANG Jin,LI Guang,CAO Wu,HU Rui-fen. Research on Auto Text Classification Model Based on PCA[J]. Journal of Beijing University of Posts and Telecommunications, 2006, 29(Z2): 136-138
Authors:ZHANG Jin  LI Guang  CAO Wu  HU Rui-fen
Affiliation:1. Dept. of Biomedical Engineering, Zhejiang University, Hangzhou 310027, China;
2. National Laboratory of Industrial Control Technology, Zhejiang University, Hangzhou 310027, China;
3. Software School, Hunan University, Changsha 410082, China;
4. School of Education, State university of New York at Potsdam, New York, USA
Abstract:Base on BP neural networks and PCA, an auto text classification model was presented. By the use of PCA, this model reduced the dimensions of feature matrix, and the parameters were optimized gradually by amounts of simulation results. The experimental results based on 20-newgroups shows that the model has better performance and can get high accuracy of text classification.
Keywords:text classification  back-propagation neural network  principal component analysis
本文献已被 万方数据 等数据库收录!
点击此处可从《北京邮电大学学报》浏览原始摘要信息
点击此处可从《北京邮电大学学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号