首页 | 本学科首页   官方微博 | 高级检索  
     

基于最大熵模型的语义块切分
引用本文:谢法奎,张全. 基于最大熵模型的语义块切分[J]. 计算机工程与应用, 2009, 45(26): 118-120. DOI: 10.3778/j.issn.1002-8331.2009.26.035
作者姓名:谢法奎  张全
作者单位:1.中国科学院 研究生院,北京 100039 2.中国科学院 声学研究所,北京 100190
基金项目:国家重点基础研究发展规划(973),中科院声学所知识创新工程项目 
摘    要:语义块切分是HNC理论的重要课题,与以往的处理策略不同,采用统计建模的方法来解决这一问题。采用词语、词性、概念等信息组成特征模板,并应用增量方法进行特征选择,构建了一个基于最大熵模型的语义块切分系统。在HNC标注语料库上的测试取得了较好的效果,开放测试的正确率和召回率分别达到了83.78%和91.17%。

关 键 词:最大熵模型  语义块  概念层次网络  
收稿时间:2008-05-19
修稿时间:2008-8-12 

Semantic chunks segmentation based on maximum entropy model
XIE Fa-kui,ZHANG Quan. Semantic chunks segmentation based on maximum entropy model[J]. Computer Engineering and Applications, 2009, 45(26): 118-120. DOI: 10.3778/j.issn.1002-8331.2009.26.035
Authors:XIE Fa-kui  ZHANG Quan
Affiliation:1.Graduate University of Chinese Academy of Sciences,Beijing 100039,China 2.Institute of Acoustics,Chinese Academy of Sciences,Beijing 100190,China
Abstract:Semantic chunks segmentaion is an important task in the Hierarchical Network of Concepts(HNC) theory.To deal with this problem,this paper adopts a new method based on statistical modeling.And forms some feature templates with word,POS, concept,and selects features by a incremental way.Finally,construct a semantic chunks segmentation system based on a maximum entropy model.The experiment is taken on HNC corpus,and the result shows that the model works well,the open test precision and recall are 83.78% and 91...
Keywords:maximum entropy model  sematic chunk  Hierarchical Network Concepts(HNC)
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《计算机工程与应用》浏览原始摘要信息
点击此处可从《计算机工程与应用》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号