首页 | 本学科首页   官方微博 | 高级检索  
     

文本自动分类关键技术研究
引用本文:张冬慧,孙波,徐照财,程显毅.文本自动分类关键技术研究[J].微计算机信息,2008,24(6):197-199.
作者姓名:张冬慧  孙波  徐照财  程显毅
作者单位:1. 北京师范大学教育技术学院,100875
2. 镇江苏大学计算机科学与通信工程学院,江苏,212013
基金项目:全国教育科学十一·五规划课题 , 资源共享体系中的关键技术研究项目(教育部重点)
摘    要:为了提高文本自动分类的准确率,本文在分析文本分类预处理阶段的中文分词、特征提取、向量空间模型、web结构挖掘技术等基础上,对相关技术进行了的改进,并设计基于支持向量机文本分类器(UJS-Classifier)实现了最终的文本分类.根据测试语料分别对中文分词模块和网页文本分类模块性能进行测试,实验结果表明UJS-Classifier在分词的歧义切分、网页分类的性能及准确率都有一定的提高.

关 键 词:中文分词  向量空间模型  文本分类  支持向量机  网页文本  自动  网页分类  技术研究  Automatic  classification  Text  Research  歧义切分  分词模块  结果  实验  性能  分类模块  中文分词  语料  测试  文本分类器  支持向量机  设计  改进
文章编号:1008-0570(2008)02-3-0197-03
修稿时间:2007年11月23

Key technologies Research of Text Automatic classification
ZHANG DONGHUI,XUN BO,XU ZHAOCAI,CHENG XIANYI.Key technologies Research of Text Automatic classification[J].Control & Automation,2008,24(6):197-199.
Authors:ZHANG DONGHUI  XUN BO  XU ZHAOCAI  CHENG XIANYI
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号