首页 | 本学科首页   官方微博 | 高级检索  
     

基于隐马尔可夫模型的引文信息提取
引用本文:张玲,黄铁军,高文.基于隐马尔可夫模型的引文信息提取[J].计算机工程,2003,29(20):33-34,54.
作者姓名:张玲  黄铁军  高文
作者单位:中国科学院计算技术研究所,北京,100080;中国科学院研究生院,北京,100039
基金项目:国家科学数字图书馆智能化网络信息搜索技术与机制研究项目(CSDL2002-18)
摘    要:提出一种基于符号特征提取的HMM结构学习方法,并利用修改的Viterbi算法进行引文信息提取。在实验结果的评价上,除了常用的准确率(Precision)、查全率(Recall)、综合评价指标(F)之外,引入了两个评价标准:宏平均和微平均来综合评价算法的性能。试验表明该方法用于引文信息提取的正确率较高。

关 键 词:隐马尔可夫模型  信息提取  引文  特征提取  宏平均  微平均  科技文章
文章编号:1000-3428(2003)20-0033-02

Citation Extraction Based on Hidden Markov Model
ZHANG Ling,HUANG Tiejun,GAO Wen.Citation Extraction Based on Hidden Markov Model[J].Computer Engineering,2003,29(20):33-34,54.
Authors:ZHANG Ling    HUANG Tiejun    GAO Wen
Affiliation:ZHANG Ling1,2,HUANG Tiejun1,2,GAO Wen1,2
Abstract:This paper puts forward a method of HMM structure learning which is based on the extraction of tokens' features, uses a variation of Viterbi algorithm to extract citation. For evaluating the method, it introduces two standards: Macro-averaging and Mico-averaging in addition to commonly used Precision, Recall and F.
Keywords:Hidden Markov model(HMM)  Information extraction  Citation  Feature extraction  Macro-averaging  Mico-averaging  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号