用于文本校对的分词与词性标注一体化算法 |
| |
引用本文: | 王永景,刘功申,李生红,荆涛.用于文本校对的分词与词性标注一体化算法[J].计算机技术与发展,2008,18(8). |
| |
作者姓名: | 王永景 刘功申 李生红 荆涛 |
| |
作者单位: | 上海交通大学,电子工程系,上海,200240 |
| |
基金项目: | 国家自然科学基金资助项目
,
教育部新世纪优秀人才支持计划项目 |
| |
摘 要: | 分词和词性标注是中文处理中的一项基本步骤,其性能的好坏很大程度上影响了中文处理的效果.传统上人们使用基于词典的机械分词法,但是,在文本校对处理中的文本错误会恶化这种方法的结果,使之后的查错和纠错就建立在一个不正确的基础上.文中试探着寻找一种适用于文本校对处理的分词和词性标注算法.提出了全切分和一体化标注的思想.试验证明,该算法除了具有较高的正确率和召回率之外,还能够很好地抑制文本错误给分词和词性标注带来的影响.
|
关 键 词: | 文本校对 分词 词性标注 一体化算法 |
One Combined Approach of Chinese Segment and Tagging for Proofreading |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 维普 万方数据 等数据库收录! |
|