基于指针标注的跨境民族文化实体关系抽取方法 |
| |
作者姓名: | 杨振平 毛存礼 雷雄丽 黄于欣 张勇丙 |
| |
作者单位: | 1. 昆明理工大学信息工程与自动化学院;2. 昆明理工大学云南省人工智能重点实验室;3. 昆明冶金高等专科学校 |
| |
基金项目: | 国家自然科学基金(62166023,61866019);;云南省自然科学基金(2019FA023);;云南省重大科技专项计划项目(202103AA080015,202002AD080001); |
| |
摘 要: | 跨境民族文化领域文本中存在较多的领域词汇,使得模型提取领域信息困难,造成上下文领域信息缺失,在该领域中实体密度分布高,面临实体关系重叠的问题。考虑到领域信息对跨境民族文化文本语义表征有着重要的作用,该文提出一种基于指针标注的跨境民族文化实体关系抽取方法,在字符向量表示中融入领域词典信息来增强领域信息用于解决领域实体标注不准确问题,通过多层指针标注解决跨境民族文化领域实体关系重叠问题。实验结果表明,在跨境民族文化实体关系抽取数据集上所提出方法相比于基线方法的F1值提升了2.34%。
|
关 键 词: | 跨境民族文化 实体关系抽取 指针标注 领域词典信息 |
|