位置标签增强的中文医学命名实体级联识别 |
| |
引用本文: | 王旭阳,赵丽婕,张继远.位置标签增强的中文医学命名实体级联识别[J].计算机工程与应用,2024(2):121-128. |
| |
作者姓名: | 王旭阳 赵丽婕 张继远 |
| |
作者单位: | 兰州理工大学计算机与通信学院 |
| |
基金项目: | 国家自然科学基金(62161019); |
| |
摘 要: | 针对一般领域的命名实体识别方法不能直接用于中文医学专业实体的识别,现有的相关研究只专注于英文文本和扁平结构的医学实体识别等问题,通过对专业领域实体识别方法的研究,结合中文医学实体的特点提出了一种面向中文医学实体的级联识别方法。将每个字符元素相对于实体的位置标签嵌入模型,并结合中文医学实体跨度内不同元素的重要程度进行实体的融合表示。通过序列标注方法检测字符的位置标签,利用字符的位置信息指导候选实体生成,并进行实体语义分类。模型在CMeEE和CCKS2018数据集以及中文糖尿病科研文献数据集上分别进行扁平实体、嵌套实体和不连续性长实体的识别实验。实验结果表明,该方法能够有效地识别中文医学文本中不同结构的实体。
|
关 键 词: | 中文医学命名实体 位置标签嵌入 结合元素重要程度的实体融合表示 级联识别 线性结构 |
|
|