首页 | 本学科首页   官方微博 | 高级检索  
     

藏文自动分词系统的设计与实现
引用本文:陈玉忠,李保利,俞士汶. 藏文自动分词系统的设计与实现[J]. 中文信息学报, 2003, 17(3): 16-20,65
作者姓名:陈玉忠  李保利  俞士汶
作者单位:北京大学计算语言学研究所
基金项目:国家自然科学基金资助项目 ( 696630 0 1),973资助项目 (G19980 30 5 0 7- 4 )
摘    要:藏文自动分词系统的研制目前在国内仍是空白。本文从四个方面详细报告了书面藏文自动分词系统的具体实现过程,内容包括系统结构、分词知识库的组织与实现以及分词策略、算法设计及其详细的自动分词过程实例。文章最后给出了实验结果,结果表明系统具有较高的切分精度和较好的通用性。

关 键 词:计算机应用  中文信息处理  格助词  接续特征  藏文  自动分词  
文章编号:1003-0077(2003)03-0015-06

The Design and Implementation of a Tibetan Word Segmentation System
CHEN Yu-zhong,LI Bao-li,YU Shi-wen. The Design and Implementation of a Tibetan Word Segmentation System[J]. Journal of Chinese Information Processing, 2003, 17(3): 16-20,65
Authors:CHEN Yu-zhong  LI Bao-li  YU Shi-wen
Affiliation:Institute of Computational Linguistics, Peking University
Abstract:Word segmentation for Tibetan has not been well studied yet. This paper reports a Tibetan word segmentation system that we designed and implemented. Several issues about the system are explained, which include system architecture, knowledge bases, segmentation strategy, and algorithms. In preliminary experiments, the system demonstrates higher accuracy and domain independency.
Keywords:computer application  Chinese information processing  case-auxiliary word  continuous feature  tibetan word segmentation
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号