首页 | 本学科首页   官方微博 | 高级检索  
     

基于KNN算法的医药信息文本分类系统的研究
引用本文:许幸,张启蕊.基于KNN算法的医药信息文本分类系统的研究[J].计算机技术与发展,2009,19(4).
作者姓名:许幸  张启蕊
作者单位:广东药学院,医药信息工程学院,广东,广州,510006
基金项目:广东省医学科学研究基金,广东药学院科研基金 
摘    要:针对目前医药信息文本分类领域的现状,设计并实现了一种基于KNN算法的医药信息文本分类系统.该系统充分利用了向量空间模型在表示方法上的优势和快速KNN算法的特点,并采用逆向最大匹配分词方法进行分词,可有效提高医药信息分类的准确性和信息处理效率.此外,构建了一个医药信息数据集,该数据集包含582篇医药类文本,其中训练文本433篇,测试文本149篇,并在该数据集上对医药信息文本分类系统进行了测试,得到了74.83%的F1值.实验证明,该系统可以较好地实现医药信息文本分类.

关 键 词:医药信息  文本分类  向量空间模型  KNN算法

Research of Medical Information Text Categorization Based on KNN Algorithm
XU Xing,ZHANG Qi-rui.Research of Medical Information Text Categorization Based on KNN Algorithm[J].Computer Technology and Development,2009,19(4).
Authors:XU Xing  ZHANG Qi-rui
Abstract:
Keywords:
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号