首页 | 本学科首页   官方微博 | 高级检索  
     

一种基于语境的中文分词方法研究
引用本文:张茂元,卢正鼎,邹春燕.一种基于语境的中文分词方法研究[J].小型微型计算机系统,2005,26(1):129-133.
作者姓名:张茂元  卢正鼎  邹春燕
作者单位:1. 华中科技大学,计算机科学与技术学院,湖北,武汉,430074
2. 华中师范大学,外国语学院,湖北,武汉,430079
摘    要:汉语不同于英语,词之间没有间隔标记.而汉语分词是文本分析的第一步,且存在歧义切分,因此分词问题成为汉语分析的首要难题,通过中文切分过程的本质分析,推导并提出基于马尔可夫链的语境中文切分理论.进而提出一种语境中文分词方法.该方法建立在词法和句法基础上,从语境角度分析歧义字段,提高分词准确率.

关 键 词:语境  中文分词  马尔可夫链  歧义切分
文章编号:1000-1220(2005)01-0129-05

Chinese Word Segmentation Based on Language Situation
ZHANG Mao-yuan,LU Zheng-ding,ZOU Chun-yan.Chinese Word Segmentation Based on Language Situation[J].Mini-micro Systems,2005,26(1):129-133.
Authors:ZHANG Mao-yuan  LU Zheng-ding  ZOU Chun-yan
Affiliation:ZHANG Mao-yuan1,LU Zheng-ding1,ZOU Chun-yan2 1
Abstract:Different from English, there are no interval marks between words in C hinese, so it is difficult for word segmentation to identify ambiguous words. Established a theory of Chinese word segmentation with language situation , and proposed a Chinese word segmentation method of language situation. The metho d improves the accuracy of word segmentation, by combining morphol ogy and syntax with language situation.
Keywords:language situation  Chinese word segmentation  Markov chain  ambiguous  word segmentation
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号