首页 | 本学科首页   官方微博 | 高级检索  
     

基于神经网络纠正器的领域分词方法
作者姓名:吴佳林  唐晋韬  李莎莎  王挺
作者单位:国防科技大学 计算机学院,湖南 长沙 410073
基金项目:国家自然科学基金(61472436,61532001)
摘    要:提出了一种基于神经网络的中文分词方法,以提高分词系统向新领域迁移的适应性和灵活性。该文方法采用了对现有分词器分词结果进行纠正的思路。这种基于纠正的两阶段方法与分词模型解耦,避免了对源领域语料和分词器构建方式的依赖。然而现有的基于纠正的方法依赖于特征工程,无法自动适应不同领域。该文利用神经网络对纠正器进行建模,在无需手工设计特征的情况下即可实现领域适应。实验表明,与当前方法相比,该文方法在领域文本上具有更好的分词性能和鲁棒性,尤其在未登录词召回率方面提升显著。

关 键 词:中文分词  领域适应  神经网络  
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号