基于关键词结构编码的涉案微博评价对象抽取模型 |
| |
作者姓名: | 王静赟 余正涛 相艳 陈龙 |
| |
作者单位: | 1.昆明理工大学信息工程与自动化学院,昆明 650500;2.昆明理工大学云南省人工智能重点实验室,昆明 650500 |
| |
基金项目: | 国家重点研发计划(2018YFC0830105, 2018YFC0830101,2018YFC0830100);云南省重大科技专项计划项目(202002AD080001);云南省基础研究专项面上项目(202001AT070047, 202001AT070046)。 |
| |
摘 要: | 涉案微博评价对象抽取旨在从微博评论中识别出用户评价的案件对象词项,有助于掌握大众对于特定案件不同方面的舆论。现有方法通常将评价对象抽取视为一个序列标注任务,但并未考虑涉案微博的领域特点,即评论通常围绕正文中出现的案件关键词展开讨论。为此,本文提出一种基于关键词结构编码的序列标注模型,进行涉案微博评价对象抽取。首先从微博正文中获取多个案件关键词,并使用结构编码机制将其转换为关键词结构表征,然后将该表征通过交互注意力机制融入评论句子表征,最后利用条件随机场(Conditional random field, CRF)抽取评价对象词项。在两个案件的数据集上进行了实验,结果表明:相较于多个基线模型,本文方法性能得以提升,验证了所提方法的有效性。
|
关 键 词: | 结构编码 涉案微博 舆情 评价对象抽取 |
收稿时间: | 2021-08-30 |
修稿时间: | 2022-01-27 |
|
| 点击此处可从《数据采集与处理》浏览原始摘要信息 |
|
点击此处可从《数据采集与处理》下载全文 |
|