首页 | 本学科首页   官方微博 | 高级检索  
     

一种面向专利文献数据的文本自动分类方法
引用本文:蒋健安,陆介平,倪巍伟,孙志挥.一种面向专利文献数据的文本自动分类方法[J].计算机应用,2008,28(1):159-161,.
作者姓名:蒋健安  陆介平  倪巍伟  孙志挥
作者单位:1. 东南大学,计算机科学与工程学院,南京,210096
2. 江苏省镇江市科技局,江苏,镇江,212001
基金项目:江苏省自然科学基金 , 高等学校博士学科点专项科研项目
摘    要:中文专利文献自动分类目前尚无成熟适用的方法。分析了文本自动分类的关键技术,并结合专利数据的特点对无词典分词和权重计算进行了改进,提出了一种适用于专利数据分类的层次分类方法,给出了面向专利文献数据的文本自动分类系统的框架模型。实验表明,该系统具有较好的分类精度与效率。

关 键 词:文本分类  专利文献  IPC  K-近邻
文章编号:1001-9081(2008)01-0159-03
收稿时间:2007-07-11
修稿时间:2007年7月11日

Automatic text categorization for patent data
JIANG Jia-nan,LU Jie-ping,NI Wei-wei,SUN Zhi-hui.Automatic text categorization for patent data[J].journal of Computer Applications,2008,28(1):159-161,.
Authors:JIANG Jia-nan  LU Jie-ping  NI Wei-wei  SUN Zhi-hui
Affiliation:JIANG Jian-an1,LU Jie-ping2,NI Wei-wei1,SUN Zhi-hui1(1.College of Computer Science , Technology,Southeast University,Nanjing Jiangsu 210096,China,2. Science , Technology Commission of Zhenjiang,Zhenjiang Jiangsu,212001,China)
Abstract:At present, there are no practical and mature automatic text categorization methods for patent data. Therefore, this paper made a research on several key techniques about text categorization, improved the non-dictionary segment and weight calculation, and then proposed a hierarchical categorization method and an automatic text categorization framework for patent data. The experiment testifies that the system has a good classification accuracy and efficiency.
Keywords:Text Categorization  Patent  IPC  KNN
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机应用》浏览原始摘要信息
点击此处可从《计算机应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号