首页 | 本学科首页   官方微博 | 高级检索  
     

面向非结构化学术文献语料库的命名实体抽取研究
作者姓名:向昕
作者单位:南京农业大学 210095
摘    要:本研究利用JASIST数据库学术论文,制定软件实体标注规则,实现网站标注系统并手工标注程序,制定机器学习模型的特征模板.利用条件随机场模型构建软件实体识别自动抽取模型和人工的软件实体数据集合.对软件实体词频次数、左右词性进行统计,调用条件随机场模型进行训练,评测测试文本的P、R、F值,从中总结相应的规律结论,最后改变特征模板,对比增加词性后软件实体抽取指标值是否有所改进.

关 键 词:命名实体  软件实体识别  网站标注  信息抽取  测评指标
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号