深层次标签辅助分类任务的层次标签文本分类方法 |
| |
引用本文: | 曹渝昆,魏子越,唐艺嘉,金成坤,李云峰.深层次标签辅助分类任务的层次标签文本分类方法[J].计算机工程与应用,2024(10):105-112. |
| |
作者姓名: | 曹渝昆 魏子越 唐艺嘉 金成坤 李云峰 |
| |
作者单位: | 1. 上海电力大学计算机科学与技术学院;2. 中国商飞上海航空工业(集团)有限公司信息中心 |
| |
基金项目: | 国家自然科学基金青年基金(61802249); |
| |
摘 要: | 层次标签文本分类是自然语言处理领域中一项具有挑战性的任务,每个文档需要被正确分类到对应具有层次结构的多个标签中。然而在标签集中,由于标签包含的语义信息不充分,同时被归类到深层次标签的文档数量过少,深层次标签训练不充分,导致显著的标签训练不平衡问题。基于此,提出了深层次标签辅助分类任务的层次标签文本分类方法(DLAC)。该方法提出了一种深层次标签辅助分类器,在标签语义增强的基础上有效利用文本特征与深层次标签对应的父标签结点(即浅层次标签的丰富特征)来提升深层次标签的分类性能。与11种算法在三个数据集上的对比实验结果表明,模型能够有效提升深层次标签的分类性能,并取得良好效果。
|
关 键 词: | 层次标签文本分类 标签层次结构 全局标签分类通道 深层次标签辅助分类通道 |
|
|