首页 | 本学科首页   官方微博 | 高级检索  
     

Web网页文本特征选择方法研究
引用本文:李会,王立峰.Web网页文本特征选择方法研究[J].计算机工程与设计,2010,31(16).
作者姓名:李会  王立峰
作者单位:1. 齐齐哈尔大学通信学院,黑龙江,齐齐哈尔,161006
2. 东北林业大学机电工程学院,黑龙江,哈尔滨,150040
基金项目:黑龙江省教育厅科学技术研究基金 
摘    要:提出了一种用于文本分类的特征选择方法.计算文本的特征值,每个特征值被赋予一个权重值,权重值的大小表示文本特征的重要程度,权重值最大的特征为决定性特征,决定性特征能代表某一类;通过构造树结构模型来消除噪音文本,同时还可以降低计算复杂度;最后改进该算法,动态的检测相对于当前节点的最佳节点更有利于进行特征选择.实验结果表明,该方法具有较高的分类精度,且计算成本较低,符合规模Web自动分类的需要.

关 键 词:特征选择  文本分类  噪音文本  决定性特征

Research of web text feature selection approach
LI Hui,WANG Li-feng.Research of web text feature selection approach[J].Computer Engineering and Design,2010,31(16).
Authors:LI Hui  WANG Li-feng
Abstract:
Keywords:Web
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号