首页 | 官方网站   微博 | 高级检索  
     

基于边界可信度相似的快速文本分类方法
引用本文:杨林波,王士同.基于边界可信度相似的快速文本分类方法[J].计算机工程与应用,2009,45(4):156-158.
作者姓名:杨林波  王士同
作者单位:1.江南大学 信息工程学院,江苏 无锡 214122 2.江南大学 创新多媒体中心,江苏 无锡 214122
基金项目:国家教育部科学技术重点研究项目 
摘    要:类别的中心和边界是类别的重要特征.利用训练样本的中心和边界作为分类准则,提出了一种基于边界可信度相似的快速文本分类算法。通过类别边界可信度调整文本与类别的相似性,克服了数据集类别间样本分布不均衡和类别中样本密度不均的缺点,提高了分类性能。实验结果表明该算法提高了文本分类的效果,显示出了较好的鲁棒性,并显著提高了文本分类效率。

关 键 词:文本分类  相似度  快速分类  
收稿时间:2008-1-9
修稿时间:2008-4-2  

Fast text categorization approach based on similarities between text boundaries
YANG Lin-bo,WANG Shi-tong.Fast text categorization approach based on similarities between text boundaries[J].Computer Engineering and Applications,2009,45(4):156-158.
Authors:YANG Lin-bo  WANG Shi-tong
Affiliation:1.School of Information,Jiangnan University,Wuxi,Jiangsu 214122,China 2.Creative Multimedia Center,Jiangnan University,Wuxi,Jiangsu 214122,China
Abstract:Center and boundaries are important characters of a class in text analysis.Using the center and boundaries as the criterion for text categorization,a fast text categorization approach based on the similarities between boundaries had been presented in this paper.By adjusting the similarity of a text to its class based on the similarity of the boundaries,the disadvantages of the imbalance of the classes and the distribution of the samples can be overcome such that the performance of text categorization may be...
Keywords:text categorization  similarity  fast categorization
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程与应用》浏览原始摘要信息
点击此处可从《计算机工程与应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号