首页 | 本学科首页   官方微博 | 高级检索  
     

用于文本校对的分词与词性标注一体化算法
引用本文:王永景,刘功申,李生红,荆涛.用于文本校对的分词与词性标注一体化算法[J].计算机技术与发展,2008,18(8).
作者姓名:王永景  刘功申  李生红  荆涛
作者单位:上海交通大学,电子工程系,上海,200240
基金项目:国家自然科学基金资助项目 , 教育部新世纪优秀人才支持计划项目
摘    要:分词和词性标注是中文处理中的一项基本步骤,其性能的好坏很大程度上影响了中文处理的效果.传统上人们使用基于词典的机械分词法,但是,在文本校对处理中的文本错误会恶化这种方法的结果,使之后的查错和纠错就建立在一个不正确的基础上.文中试探着寻找一种适用于文本校对处理的分词和词性标注算法.提出了全切分和一体化标注的思想.试验证明,该算法除了具有较高的正确率和召回率之外,还能够很好地抑制文本错误给分词和词性标注带来的影响.

关 键 词:文本校对  分词  词性标注  一体化算法

One Combined Approach of Chinese Segment and Tagging for Proofreading
Abstract:
Keywords:
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号