首页 | 本学科首页   官方微博 | 高级检索  
     

基于最大熵模型的组块分析
引用本文:李素建,刘群,杨志峰.基于最大熵模型的组块分析[J].计算机学报,2003,26(12):1722-1727.
作者姓名:李素建  刘群  杨志峰
作者单位:北京大学计算语言学研究所,北京,100871
基金项目:国家“九七三”重点基础研究发展规划项目 (G1 9980 30 50 4 0 1 ,G1 9980 30 50 7 4)资助
摘    要:采用最大熵模型实现中文组块分析的任务.首先明确了中文组块的定义,并且列出了模型中所有的组块类型和组块标注符号.组块划分和识别的过程可以转化为对于每一个词语赋予一个组块标注符号的过程,我们可以把它作为一个分类问题根据最大熵模型来解决.最大熵模型的关键是如何选取有效的特征,文中给出了相关的特征选择过程和算法.最后给出了系统实现和实验结果.

关 键 词:自然语言处理  最大熵模型  组块分析  句法分析  信息处理
修稿时间:2002年4月8日

Chunk Parsing with Maximum Entropy Principle
LI Su-Jian LIU Qun YANG Zhi-Feng.Chunk Parsing with Maximum Entropy Principle[J].Chinese Journal of Computers,2003,26(12):1722-1727.
Authors:LI Su-Jian LIU Qun YANG Zhi-Feng
Abstract:This paper proposes to use Maximum Entropy (ME) model to conduct Chinese chunk parsing. First we define Chinese chunks and list all chunk categories and tags used in the model. Thus the process of chunking can be regarded as a classification problem which trains from the corpus with chunk tags and POS tags. The focus of ME model is how to select useful features. Then, the procedure and algorithms of feature selection is introduced. At last we test the model, and experimental results are given.
Keywords:chunk parsing  syntactic parsing  maximum entropy principle  partial parsing
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号