首页 | 本学科首页   官方微博 | 高级检索  
     

中文分词与词性标注研究
作者姓名:梁喜涛  顾磊
作者单位:南京邮电大学计算机学院
基金项目:国家自然科学基金资助项目(61302157);教育部人文社会科学研究青年基金(12YJC870008);江苏省教育高校哲学社会科学基金(2013SJB870004);江苏省社科研究文化精品课题(12SWC-030)
摘    要:分词和词性标注是中文语言处理的重要技术,广泛应用于语义理解、机器翻译、信息检索等领域。在搜集整理当前分词和词性标注研究与应用成果的基础上,对中文分词和词性标注的基本方法进行了分类和探讨。首先在分词方面,对基于词典的和基于统计的方法进行了详细介绍,并且列了三届分词竞赛的结果;其次在词性标注方面,分别对基于规则的方法和基于统计的方法进行了阐述;接下来介绍了中文分词和词性标注一体化模型相关方法。此外还分析了各种分词和词性标注方法的优点和不足,在此基础上,为中文分词和词性标注的进一步发展提供了建议。

关 键 词:中文分词  主动学习  词性标注  自然语言处理  一体化模型
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号