首页 | 本学科首页   官方微博 | 高级检索  
     

数字人文环境下融入多特征的词命名实体识别
引用本文:张朦,刘忠宝. 数字人文环境下融入多特征的词命名实体识别[J]. 计算机系统应用, 2023, 32(3): 300-308
作者姓名:张朦  刘忠宝
作者单位:中北大学 软件学院, 太原 030051;中北大学 软件学院, 太原 030051;北京语言大学 语言智能研究院, 北京 100083
基金项目:教育部哲学社会科学研究后期项目(21JHQ081)
摘    要:近年来, 数字人文受到广泛关注, 数字人文环境下的词命名实体识别研究日渐兴起, 但鲜有研究从字特征的特征表示能力、分词的准确性、领域知识的有效性等方面进行探究. 鉴于此, 针对汉字的象形文字特点和词文本的特殊性, 在字特征的基础上, 引入部首特征、格律特征和声韵特征, 提出特征增强单元和特征抽取单元, 并将词牌知识三元组通过ANALOGY得到的知识向量表示为词牌知识向量, 通过双向长短时记忆网络、注意力机制等模型将部首向量、字向量、格律向量、声韵向量、词牌知识向量进行深度融合, 最终构建出融入多特征的词命名实体识别方法. 在《花间集全译》自制语料上的对比实验和消融实验的结果表明, 本文所提方法能够有效利用多特征提升词命名实体识别性能. 其F1值达到了85.63%, 完成了词命名实体识别任务.

关 键 词:命名实体识别  多特征  格律  数字人文  诗词
收稿时间:2022-08-17
修稿时间:2022-09-15

Named Entity Recognition of Poetry by Integrating Multi-features in Digital Humanities
ZHANG Meng,LIU Zhong-Bao. Named Entity Recognition of Poetry by Integrating Multi-features in Digital Humanities[J]. Computer Systems& Applications, 2023, 32(3): 300-308
Authors:ZHANG Meng  LIU Zhong-Bao
Affiliation:School of Software, North University of China, Taiyuan 030051, China; School of Software, North University of China, Taiyuan 030051, China;Institute of Language Intelligence, Beijing Language and Culture University, Beijing 100083, China
Abstract:
Keywords:named entity recognition  multi-features  metrical rule  digital humanities  poetry
点击此处可从《计算机系统应用》浏览原始摘要信息
点击此处可从《计算机系统应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号