置信度加权在线序列标注算法 |
| |
引用本文: | 汤步洲, 王晓龙, 王轩. 置信度加权在线序列标注算法. 自动化学报, 2011, 37(2): 188-195. doi: 10.3724/SP.J.1004.2011.00188 |
| |
作者姓名: | 汤步洲 王晓龙 王轩 |
| |
作者单位: | 1.哈尔滨工业大学深圳研究生院计算机科学与技术学科部 深圳 518055 |
| |
基金项目: | 国家高技术研究发展计划(863计划)(2006AA01Z197); 国家自然科学基金(60703015,60973076)资助~~ |
| |
摘 要: | 序列标注问题是自然语言处理领域的基本问题之一. 序列标注任务是将连续输入的不定长序列, 标注成连续等长的标签序列. 在在线序列标注方法的基本框架下, 针对序列标注任务的特征稀疏特性, 采用置信度加权分类算法思想, 提出了一种新的线性判别式在线序列标注方法---置信度加权在线序列标注算法. 该方法对每个特征权值参数引入一个概率置信度, 取得了优于其他相关算法的性能. 在中文分词, 中文名实体识别以及英文组块分析等问题上, 验证了本文方法的有效性.
|
关 键 词: | 序列标注问题 自然语言处理 在线序列标注算法 置信度加权 概率置信度 |
收稿时间: | 2010-04-29 |
修稿时间: | 2010-10-08 |
本文献已被 CNKI 等数据库收录! |
| 点击此处可从《自动化学报》浏览原始摘要信息 |
|
点击此处可从《自动化学报》下载免费的PDF全文 |
|