首页 | 本学科首页   官方微博 | 高级检索  
     

利用遗传算法实现词类标记集的优化
引用本文:孙宏林,俞士汶,陆勤. 利用遗传算法实现词类标记集的优化[J]. 中文信息学报, 2001, 15(1): 19-27
作者姓名:孙宏林  俞士汶  陆勤
作者单位:1.北京大学计算语言学研究所2.香港理工大学电子计算学系3.北京语言文化大学语言信息处理研究所
基金项目:973项目 !(G19980 30 50 7-4 ),国家自然科学基金项目 !( 69973 0 0 5),香港理工大学研究基金
摘    要:过去词类标记集的选择主要基于专家的经验知识,缺乏自动或半自动的方法来辅助这一过程。本文提出了一种利用遗传算法来搜索优化的标记集的新方法。这种方法可以在一个候选标记集集合中自动搜索一个最优或较优的标记集,并可根据应用的需求调整参数以适应特定任务的需求。实验表明:遗传算法为标记集的选择提供了一种系统的有效的辅助手段。

关 键 词:词性标注  词类  标记集  遗传算法  
修稿时间:2000-05-23

Using Genetic Algorithms for Optimizing Part of Speech Tagset
SUN Hong-lin,YU Shi-wen,LU Qin. Using Genetic Algorithms for Optimizing Part of Speech Tagset[J]. Journal of Chinese Information Processing, 2001, 15(1): 19-27
Authors:SUN Hong-lin  YU Shi-wen  LU Qin
Affiliation:1.Institute of Computational Linguistics Peking University2.Department of Computing ,Hong Kong Polytechnic University3.Center for Language Information Processing ,Beijing Language & Culture University
Abstract:POS tagset selection in the past was mainly done by experts using human knowledge manually,since there is no automatic or semi automatic way to assist the selection process.This paper proposes a novel method to search for an optimal POS tagset using genetic algorithms (GA).The experiment shows that GA provides an efficient optimization of POS tagset and allows for the adjustment of parameters according to user requirement.It provides a systematic way to help people in making an intelligent choice on the selection of a tagset.
Keywords:POS tagging  word class  POS tagset  genetic algorithm
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号