首页 | 本学科首页   官方微博 | 高级检索  
     

基于词边界分类的中文分词方法
引用本文:李寿山,黄居仁. 基于词边界分类的中文分词方法[J]. 中文信息学报, 2010, 24(1): 3-8
作者姓名:李寿山  黄居仁
作者单位:香港理工大学 中文及双语学系,香港
基金项目:香港理工大学新教授启动资助项目(1-BBZM)
摘    要:该文研究和探讨一种新的分词方法 基于词边界分类的方法。该方法直接对字符与字符之间的边界进行分类,判断其是否为两个词之间的边界,从而达到分词的目的。相对于目前主流的基于字标注的分词方法,该方法的实现和训练更加快速、简单和直接,但却能获得比较接近的分词效果。更显著的是我们可以很容易地从词边界分类方法获得在线分词学习方法,该方法能够使我们的分词系统非常迅速地学习新的标注样本。

关 键 词:计算机应用  中文信息处理  中文分词  WBD方法  在线学习  

Chinese Word Segmentation Based on Word Boundary Decision
LI Shoushan,HUANG Chu-Ren. Chinese Word Segmentation Based on Word Boundary Decision[J]. Journal of Chinese Information Processing, 2010, 24(1): 3-8
Authors:LI Shoushan  HUANG Chu-Ren
Affiliation:Department of Chinese & Bilingual Studies,the Hong Kong Polytechnic University,Hong Kong,China
Abstract:This paper focuses on the word boundary decision(WBD) approach to Chinese word segmentation.This new approach classifies a boundary between two characters into either a word boundary or not.Compared to the stat-of-the-arts methods based on character tagging,this approach is easier to implement and faster to execute,as well as a competitive performance.Particularly,the robust online learning module can be added to adapt a WBD system to new data quickly,enabling a reliable online Chinese segmentation system w...
Keywords:computer application  Chinese information processing  Chinese word segmentation  WBD approach  online learning  
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号