首页 | 本学科首页   官方微博 | 高级检索  
     

一种自组织的汉语组合型歧义消歧方法
引用本文:冯素琴,陈惠明.一种自组织的汉语组合型歧义消歧方法[J].计算机工程与设计,2007,28(3):737-739,742.
作者姓名:冯素琴  陈惠明
作者单位:忻州师范学院计算机科学与技术系 山西忻州034000
基金项目:山西省忻州师范学院基金
摘    要:组合型歧义切分字段一直是汉语自动分词的难点.用人工校验后的分词语料提供的搭配实例作为组合歧义字段的初始搭配知识,提出使用搭配统计表的多元最大对数似然比进行消歧;继而根据实验确定了歧义字段的上下文窗口、窗口位置区分、权值估计等要素;在此基础上采用自组织方法自动扩充搭配集,使消歧信息趋于稳定;最后,对提出的方法进行了实验,实验表明,该算法能有效提高消歧准确率.

关 键 词:自然语言处理  汉语自动分词  组合型切分歧义  自组织方法  消歧  自组织方法  汉语自动分词  组合型  歧义字段  消歧方法  method  combinatorial  Chinese  准确率  算法  实验确定  稳定  信息  要素  权值估计  位置区  窗口  上下文  对数似然比  统计表
文章编号:1000-7024(2007)03-0737-03
修稿时间:2006-01-15

Adaptive Chinese combinatorial ambiguities disambiguate method
FENG Su-qin,CHEN Hui-ming.Adaptive Chinese combinatorial ambiguities disambiguate method[J].Computer Engineering and Design,2007,28(3):737-739,742.
Authors:FENG Su-qin  CHEN Hui-ming
Abstract:Combinatorial ambiguity is a vital issue in Chinese word segmentation.A multi maximal log disambiguation algorithm bycollocations provided by using the checked word segmentation is presented;Then the key factors regarding combinatorial ambiguities isdetermined by experiments(the size of the context windows,the sensitivity of locations in the windows as well as weighting of featureword);And then adaptive Chinese combinatorial ambiguities disambiguate method is used to strengthen and stabilize collocations;Atlastly,the method is tested and proved that it can well raise accuracy.
Keywords:natural language processing  Chinese word segmentation  combinatorial ambiguities  adaptive method  disambiguate
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号