首页
|
本学科首页
官方微博
|
高级检索
全部学科
医药、卫生
生物科学
工业技术
交通运输
航空、航天
环境科学、安全科学
自然科学总论
数理科学和化学
天文学、地球科学
农业科学
哲学、宗教
社会科学总论
政治、法律
军事
经济
历史、地理
语言、文字
文学
艺术
文化、科学、教育、体育
马列毛邓
全部专业
中文标题
英文标题
中文关键词
英文关键词
中文摘要
英文摘要
作者中文名
作者英文名
单位中文名
单位英文名
基金中文名
基金英文名
杂志中文名
杂志英文名
栏目中文名
栏目英文名
DOI
责任编辑
分类号
杂志ISSN号
面向非结构化学术文献语料库的命名实体抽取研究
作者姓名:
向昕
作者单位:
南京农业大学 210095
摘 要:
本研究利用JASIST数据库学术论文,制定软件实体标注规则,实现网站标注系统并手工标注程序,制定机器学习模型的特征模板.利用条件随机场模型构建软件实体识别自动抽取模型和人工的软件实体数据集合.对软件实体词频次数、左右词性进行统计,调用条件随机场模型进行训练,评测测试文本的P、R、F值,从中总结相应的规律结论,最后改变特征模板,对比增加词性后软件实体抽取指标值是否有所改进.
关 键 词:
命名实体
软件实体识别
网站标注
信息抽取
测评指标
本文献已被
万方数据
等数据库收录!
设为首页
|
免责声明
|
关于勤云
|
加入收藏
Copyright
©
北京勤云科技发展有限公司
京ICP备09084417号