首页 | 本学科首页   官方微博 | 高级检索  
     

基于特征选择的网页分类方法研究
引用本文:原福永,于歌,崔春华. 基于特征选择的网页分类方法研究[J]. 计算机工程与设计, 2007, 28(17): 4282-4284
作者姓名:原福永  于歌  崔春华
作者单位:燕山大学,信息科学与工程学院,河北,秦皇岛,066004
摘    要:随着网络信息的迅猛发展,信息处理已经成为人们获取有用信息不可缺少的工具,文本自动分类系统是信息处理的重要研究方向.对文本分类关键技术中的特征选择算法进行了探讨,并结合网页特性,对特征权重算法及互信息算法进行了改进.实验结果证明,改进算法是可行的.

关 键 词:自动分类  特征选择  向量空间模型  互信息  准确率  特征选择算法  网页  分类方法  研究  feature selection  based  categorization  pages  改进算法  结果  实验  互信息  特征权重  特性  结合  文本分类  方向  分类系统  自动  信息处理
文章编号:1000-7024(2007)17-4282-03
修稿时间:2006-09-12

Study on web pages categorization based on feature selection
YUAN Fu-yong,YU Ge,CUI Chun-hua. Study on web pages categorization based on feature selection[J]. Computer Engineering and Design, 2007, 28(17): 4282-4284
Authors:YUAN Fu-yong  YU Ge  CUI Chun-hua
Affiliation:College of Information Science and Engineering, Yanshan University, Qinhuangdao 066004, China
Abstract:With the rapid development of information networks,information processing has become an indispensable tool for obtaining useful information,the text automatic categorization systems is an important research direction of information processing.The feature selection algorithms in the automated text categorization technology are deeply analyzed,and then the algorithm of term weighting and the mutual information algorithm are improved in view of the construct character of the web text.At last,the experimental results show that,the improvement algorithm is feasible.
Keywords:automatic categorization  feature selection  vector space mode  mutual information  precision
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号