首页 | 本学科首页   官方微博 | 高级检索  
     

面向自然过程文本的案例信息抽取
引用本文:倪维健,韦振胜,曾庆田,刘彤.面向自然过程文本的案例信息抽取[J].计算机集成制造系统,2018(7).
作者姓名:倪维健  韦振胜  曾庆田  刘彤
作者单位:山东科技大学计算机科学与工程学院
摘    要:针对描述具体流程案例信息的自然文本,提出一种案例自动抽取方法,实现了无结构过程文本向结构化事件日志转换,从而为后续的过程挖掘研究提供数据支持。首先对过程文本案例抽取任务进行了形式化描述,抽象出活动/属性实体识别、活动/属性关系识别、活动顺序关系识别3个核心任务,然后应用半监督统计学习技术分别设计了解决方法。选取中文菜谱文档为实例开展了大规模实验研究,对所提出的案例信息抽取方法的有效性进行了全面评估。实验结果表明,所提方法能够在少量人工标注数据的基础上有效利用同领域内大量未标注过程文本提升案例抽取效果,且无需人工设计复杂的规则,具有良好的领域适用性。

本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号