首页 | 本学科首页   官方微博 | 高级检索  
     

基于中文文本分类的分词方法研究
引用本文:湛燕,陈昊,袁方,王熙照.基于中文文本分类的分词方法研究[J].计算机工程与应用,2003,39(23):87-88,91.
作者姓名:湛燕  陈昊  袁方  王熙照
作者单位:河北大学数学与计算机科学学院,保定,071002
基金项目:河北省自然科学基金(编号:698139),河北省教育厅科研计划项目(编号:2001206)
摘    要:文本分类有助于用户有选择地阅读和处理海量文本,因此其预备工作分词系统的研究是很有意义的。该文主要提出了一种基于中文文本分类的分词方法,区别于常用的基于字符串匹配等方法,并利用数据库特有的查询技术设计和实现了该分词系统,旨在通过新的分词方法提供更加准确的分词率,同时提高系统实现效率。

关 键 词:文本分类  分词  查询  数据库  主题词
文章编号:1002-8331-(2003)23-0087-02

Word Segmentation Method Research Based on Chinese Text Classification
Zhan Yan Chen Hao Yuan Fang Wang Xizhao.Word Segmentation Method Research Based on Chinese Text Classification[J].Computer Engineering and Applications,2003,39(23):87-88,91.
Authors:Zhan Yan Chen Hao Yuan Fang Wang Xizhao
Abstract:Text classification is helpful for user to read and handle vast amounts of texts selectively,whose preliminary work-the research of word segmentation is significative.In order to offer a new method for exacter partition rate and improve system implementation efficiency,this paper mainly puts forward a word segmentation method based on Chinese text classification,which is different from regular methods such as based on character string matching,also designs and implements this word segmentation system using special querying technology in database.
Keywords:Text classification  Word segmentation  Query  Database  Thematic words
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号