首页 | 本学科首页   官方微博 | 高级检索  
     

基于最大熵方法汉语基本短语分析
引用本文:朱冲,王大为,张向利.基于最大熵方法汉语基本短语分析[J].计算机工程与应用,2008,44(32):137-139.
作者姓名:朱冲  王大为  张向利
作者单位:1. 桂林电子科技大学,信息与通信学院,广西,桂林,541004
2. 冲国科学技术大学,自动化系,合肥,230026;中国科学院,合肥智能机械研究所,合肥,230031
基金项目:国家高技术研究发展计划(863计划),国家科技支撑计划
摘    要:提出了一个汉语基本短语分析模型,将汉语短语的边界划分和短语标识分开,假定这两个过程相互独立,采用最大熵方法分别建立模型解决。最大熵模型的关键是如何选取有效的特征,文中给出了两个步骤相关的特征空间以及特征选择过程和算法。实验表明,模型的短语定界精确率达到95.27%,标注精确率达到96.2%。

关 键 词:短语分析  潜层句法  最大熵原理
收稿时间:2007-12-11
修稿时间:2008-2-27  

Chinese base phrase parsing based on maximum entropy model
ZHU Chong,WANG Dawei,ZHANG Xiangli.Chinese base phrase parsing based on maximum entropy model[J].Computer Engineering and Applications,2008,44(32):137-139.
Authors:ZHU Chong  WANG Dawei  ZHANG Xiangli
Affiliation:1.Information &; Communication College,Guilin University of Electronic Technology,Guilin,Guangxi 541004,China 2.Department of Automation,University of Science and Technology of China,Hefei 230026,China 3.Institute of Intelligent Machines,Chinese Academy of Sciences,Hefei 230031,China
Abstract:This paper presents a basic Chinese phrase parsing model,which separates the prediction of the phrase boundary location and tagging,a maximum entropy method is adopted to solve the model,respectively.The focus of ME model is how to select useful features.The procedure and algorithms of feature selection with feature space are given.Experimental results demon- strate that the precision for predicting the phrase boundary is 95.27%,and the precision of phrase tagging is 96.2%.
Keywords:phrase parsing  latent syntax  maximum entropy principle
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《计算机工程与应用》浏览原始摘要信息
点击此处可从《计算机工程与应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号