首页 | 本学科首页   官方微博 | 高级检索  
     

基于最大熵的隐马尔可夫模型文本信息抽取
引用本文:林亚平,刘云中,周顺先,陈治平,蔡立军.基于最大熵的隐马尔可夫模型文本信息抽取[J].电子学报,2005,33(2):236-240.
作者姓名:林亚平  刘云中  周顺先  陈治平  蔡立军
作者单位:湖南大学计算机与通信学院,湖南长沙 410082
摘    要:文本信息抽取是处理海量文本的重要手段之一.最大熵模型提供了一种自然语言处理的方法.提出了一种基于最大熵的隐马尔可夫模型文本信息抽取算法.该算法结合最大熵模型在处理规则知识上的优势,以及隐马尔可夫模型在序列处理和统计学习上的技术基础,将每个观察文本单元所有特征的加权之和用来调整隐马尔可夫模型中的转移概率参数,实现文本信息抽取.实验结果表明,新的算法在精确度和召回率指标上比简单隐马尔可夫模型具有更好的性能.

关 键 词:人工智能  文本信息抽取  隐马尔可夫模型  最大熵  
文章编号:0372-2112(2005)02-0236-05
收稿时间:2004-02-18

Using Hidden Markov Model for Text Information Extraction Based on Maximum Entropy
LIN Ya-ping,LIU Yun-zhong,ZHOU Shun-xian,CHEN Zhi-ping,CAI Li-jun.Using Hidden Markov Model for Text Information Extraction Based on Maximum Entropy[J].Acta Electronica Sinica,2005,33(2):236-240.
Authors:LIN Ya-ping  LIU Yun-zhong  ZHOU Shun-xian  CHEN Zhi-ping  CAI Li-jun
Affiliation:College of Computer and Communication,Hunan University,Changsha,Hunan 410082,China
Abstract:Text information extraction is an important approach to processing large quantity of text.Maximum entropy provides a kind of framework for natural language processing.A new algorithm using hidden Markov model based on maximal entropy is proposed for text information extraction.The new algorithm combines the advantage of maximum entropy model,which can integrate and process rules and knowledge efficiently,with that of hidden Markov model,which has powerful technique foundations to solve sequence representation and statistical problem,and uses the sum of all features with weights to adjust the transition parameters in hidden Markov model for text information extraction.Experimental results show that the new algorithm improves the performance in precision and recall.
Keywords:artificial intelligence  text information extraction  hidden markov model  maximal entropy  
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《电子学报》浏览原始摘要信息
点击此处可从《电子学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号