首页 | 本学科首页   官方微博 | 高级检索  
     

健壮性学习算法
引用本文:刘颖. 健壮性学习算法[J]. 中文信息学报, 2001, 15(4): 2-7
作者姓名:刘颖
作者单位:清华大学中文系
基金项目:国家自然资金项目!(6 9972 0 2 5 )
摘    要:使用统计方法可以对汉英机器翻译的词性标注和句法语义分析阶段产生的歧义进行消歧,在估计过程中往往使用最大可能方法,但是并不是在所有的情况下取最大值都是正确的。为了从所有候选结果中取到正确的结果,本文使用健壮性学习算法。使用这个算法,当正确的候选结果评分不是最高时,仍能通过健壮性算法来调整正确结果的评分,使之最大,并且降低不正确候选的评分。而且,由于训练集与测试集存在不同,使训练集中的错误率最小不能保证测试集中的错误率也最小。因此当考虑训练语料库和测试语料库存在统计变化时,应该使用健壮性学习算法。

关 键 词:健壮性学习算法  机器翻译  评分  
修稿时间:2000-11-15

Robust Learning Algorithm
LIU Ying. Robust Learning Algorithm[J]. Journal of Chinese Information Processing, 2001, 15(4): 2-7
Authors:LIU Ying
Affiliation:Department of Chinese Language and Literature ,Tsinghua University
Abstract:Disambiguities of part of speech tagging , syntactic and semantic analysis are disambiguted using statistical method. Maximal likelihood principle is used for disambiguting, but it is not all right under all conditions. Robust learning algorithm is used in this paper in order to acquire the right result among all candidates. When score of the right candidate is not maximal, it can be adjusted using robust learning algorithm, thus score of the right candidate is maximal and score of the wrong candidate is reduced. Moreover, there is difference between training set and test set, wrong rate of training set is minimal but wrong rate of test set is not minimal. When there is statistical difference between training set and test set, robust learning algorithm should be used.
Keywords:robust learning algorithm  machine translation  score
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号