首页 | 本学科首页   官方微博 | 高级检索  
     

基于半监督CRF的缩略词扩展解释识别
引用本文:陈季梦,刘杰,黄亚楼,刘天笔,刘才华. 基于半监督CRF的缩略词扩展解释识别[J]. 计算机工程, 2013, 39(4)
作者姓名:陈季梦  刘杰  黄亚楼  刘天笔  刘才华
作者单位:1. 南开大学信息技术科学学院,天津,300071
2. 南开大学信息技术科学学院,天津300071;南开大学软件学院,天津300071
3. 南开大学软件学院,天津,300071
基金项目:国家自然科学基金资助项目,高等学校博士学科点专项科研基金资助项目,中央高校基本科研业务费专项基金资助项目
摘    要:缩略词拓展解释识别任务中标注样本较少,无法从中总结出全面的规则或采用有监督的学习方法来学习.为此,提出一种基于半监督条件随机场(CRF)的缩略词扩展解释识别模型,利用广泛的未标注样本和较少的标注样本寻找序列文本中恰当的语句,以解释给定的缩略词.使用较少的标注序列样本训练一个全监督CRF模型,针对未标注序列样本,采用最小序列熵学习样本之间的联系,结合标注样本和未标注样本,利用半监督自学习方法学习两者的关系.实验结果表明,该模型的序列F1值达到84.73%,高于支持向量机和全监督CRF基准算法.

关 键 词:扩展解释  半监督  条件随机场  序列熵  序列标注

Abbreviation Expansion Interpretation Recognition Based on Semi-supervised CRF
CHEN Ji-meng , LIU Jie , HUANG Ya-lou , LIU Tian-bi , LIU Cai-hua. Abbreviation Expansion Interpretation Recognition Based on Semi-supervised CRF[J]. Computer Engineering, 2013, 39(4)
Authors:CHEN Ji-meng    LIU Jie    HUANG Ya-lou    LIU Tian-bi    LIU Cai-hua
Abstract:
Keywords:expansion interpretation  semi-supervised  conditional random field  sequence entropy  sequence labeling
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号