基于SVM的Web文本快速增量分类算法* |
| |
作者姓名: | 丁文军 薛安荣 |
| |
作者单位: | 江苏大学计算机科学与通信工程学院,江苏镇江,212013 |
| |
基金项目: | 高校博士点基金资助项目(20093227110005);校高级人才启动基金资助项目(09JDG041);省科技型企业创新资金资助项目(BC2010172) |
| |
摘 要: | 针对基于支持向量机的Web文本分类效率低的问题,提出了一种基于支持向量机Web文本的快速增量分类FVI-SVM算法。算法保留增量训练集中违反KKT条件的Web文本特征向量,克服了Web文本训练集规模巨大,造成支持向量机训练效率低的缺点。算法通过计算支持向量的共享最近邻相似度,去除冗余支持向量,克服了在增量学习过程中不断加入相似文本特征向量而导致增量学习的训练时间消耗加大、分类效率下降的问题。实验结果表明,该方法在保证分类精度的前提下,有效提高了支持向量机的训练效率和分类效率。
|
关 键 词: | 支持向量机 支持向量 最优分类超平面 KKT条件 文本特征向量 |
本文献已被 CNKI 万方数据 等数据库收录! |
| 点击此处可从《计算机应用研究》浏览原始摘要信息 |
|
点击此处可从《计算机应用研究》下载全文 |
|