首页 | 本学科首页   官方微博 | 高级检索  
     

基于蚁群聚集信息素的半监督文本分类算法
引用本文:杜芳华,冀俊忠,吴晨生,吴金源. 基于蚁群聚集信息素的半监督文本分类算法[J]. 计算机工程, 2014, 0(11): 167-171
作者姓名:杜芳华  冀俊忠  吴晨生  吴金源
作者单位:1. 北京工业大学计算机学院多媒体与智能软件技术北京市重点实验室,北京,100124
2. 北京市科学技术情报研究所,北京,100048
基金项目:国家自然科学基金资助项目(61375059
摘    要:半监督文本分类中已标记数据与未标记数据分布不一致,可能导致分类器性能较低。为此,提出一种利用蚁群聚集信息素浓度的半监督文本分类算法。将聚集信息素与传统的文本相似度计算相融合,利用Top-k策略选取出未标记蚂蚁可能归属的种群,依据判断规则判定未标记蚂蚁的置信度,采用随机选择策略,把置信度高的未标记蚂蚁加入到对其最有吸引力的训练种群中。在标准数据集上与朴素贝叶斯算法和EM算法进行对比实验,结果表明,该算法在精确率、召回率以及F1度量方面都取得了更好的效果。

关 键 词:文本分类  半监督学习  聚集信息素  自训练  Top-k策略  随机选择策略

Semi-supervised Text Classification Algorithm Based on Ant Colony Aggregation Pheromone
DU Fanghua , JI Junzhong , WU Chensheng , WU Jinyuan. Semi-supervised Text Classification Algorithm Based on Ant Colony Aggregation Pheromone[J]. Computer Engineering, 2014, 0(11): 167-171
Authors:DU Fanghua    JI Junzhong    WU Chensheng    WU Jinyuan
Abstract:
Keywords:text classification  semi-supervised learning  aggregation pheromone  self-training  Top-k strategy  random selection strategy
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号