基于含边界词性特征的中文命名实体识别 |
| |
作者姓名: | 邱莎 王付艳 申浩如 段玻 阿圆 丁海燕 |
| |
作者单位: | 1. 昆明学院信息技术学院,昆明650214;复旦大学计算机科学技术学院,上海201203 2. 昆明学院信息技术学院,昆明,650214 3. 云南大学信息学院,昆明,650091 |
| |
基金项目: | 昆明学院科研课题基金资助项目 |
| |
摘 要: | 根据词性在任务中可能出现的特征表达,在字粒度一级,基于条件随机场模型,对词性特征在中文命名实体识别任务中的应用进行研究,提出一种将词性和词边界合成为一个特征项的方法。在相同实验环境下针对多种词性特征的应用情况,采用序列标注的方式在公共语料上进行多次中文命名实体识别实验。通过对多次实验结果的比较分析得出,二级词性与词边界合成的特征在系统执行性能和识别效果等方面均为最优。
|
关 键 词: | 中文命名实体识别 条件随机场 特征模板 词性 词边界 标注集 |
收稿时间: | 2011-08-23 |
本文献已被 CNKI 万方数据 等数据库收录! |
| 点击此处可从《计算机工程》浏览原始摘要信息 |
|
点击此处可从《计算机工程》下载免费的PDF全文 |
|