基于有监督学习的医古文叙述性术语语义标注 |
| |
引用本文: | 丁长林,白宇,蔡东风.基于有监督学习的医古文叙述性术语语义标注[J].中文信息学报,2015,29(2):49-57. |
| |
作者姓名: | 丁长林 白宇 蔡东风 |
| |
作者单位: | 沈阳航空航天大学 知识工程研究中心 计算机学院,辽宁 沈阳 110136 |
| |
基金项目: | 国家基础科研973计划(2010CB530401) |
| |
摘 要: | 对自由文本形式的中医古籍文献(医古文)进行标注,是对其进行深入分析的前提,语义标注技术是实现该目的的方法之一。该文将中医古籍文献中包含的术语分为名称性术语以及叙述性术语。在分析叙述性术语特点的基础上,将对其语义标注转化为基于有监督学习的短句序列标注或分类问题,并提出了名词性术语规约操作以及基于知网的替换操作两种预处理方法。最后该文通过实验对比了三种学习模型及四种特征选择算法,并证明了问题转化的可行性以及两种预处理方法的有效性。
|
关 键 词: | 语义标注 叙述性术语 有监督学习 中医古籍文献 |
本文献已被 CNKI 等数据库收录! |
| 点击此处可从《中文信息学报》浏览原始摘要信息 |
|
点击此处可从《中文信息学报》下载全文 |
|