首页 | 本学科首页   官方微博 | 高级检索  
     

基于错误驱动学习策略的藏语句法功能组块边界识别
引用本文:王天航,史树敏,龙从军,黄河燕,李 琳. 基于错误驱动学习策略的藏语句法功能组块边界识别[J]. 中文信息学报, 2014, 28(5): 170-175
作者姓名:王天航  史树敏  龙从军  黄河燕  李 琳
作者单位:1. 北京理工大学 计算机学院,北京 100081;
2. 北京市海量语言信息处理与云计算应用工程技术研究中心,北京 100081;
3. 中国社会科学院民族学与人类学研究所,北京 100081
基金项目:国家自然科学基金 (61201352,61132009);国家重点基础研究发展规划(973)(2013CB329303);北京理工大学基础研究基金 (20130742010)
摘    要:藏语句法功能组块分析旨在识别出藏语句子的句法成分,为后续句子级深入分析提供支持。根据藏语的语言特点,该文在藏语句法功能组块描述体系基础上,提出基于错误驱动学习策略的藏语功能组块边界识别方法。具体思路为,首先基于条件随机场(Conditional Random Fields,CRFs)识别组块,然后分别基于转换规则的错误驱动学习(Transformation-based Error-driven Learning,TBL)及基于新特征模板的CRFs错误驱动学习进行二次识别,并对初次结果进行校正,F值分别提高了1.65%、 8.36%。最后通过实验分析,进一步将两种错误驱动学习机制融合,在18073词级的藏语语料上开展实验,识别性能进一步提高,准确率、召回率与F值分别达到94.1%、94.76%与94.43%,充分验证了本文提出方法的有效性。

关 键 词:错误驱动学习  藏语句法功能组块  组块边界识别  CRFs  TBL  

Tibetan Chunking Based on Error-Driven Learning Strategy
WANG Tianhang,SHI Shumin,LONG Congjun,HUANG Heyan,LI Lin. Tibetan Chunking Based on Error-Driven Learning Strategy[J]. Journal of Chinese Information Processing, 2014, 28(5): 170-175
Authors:WANG Tianhang  SHI Shumin  LONG Congjun  HUANG Heyan  LI Lin
Affiliation:1. School of Computer Science & Technology, Beijing Institute of Technology, Beijing 100081, China;
2. Beijing Engineering Research Center of High Volume Language Information processing & Cloud Computing Applications, Beijing 100081, China;
3. Institute of Ethnology & Anthropology Chinese Academy of Social Sciences, Beijing 100081, China
Abstract:
Keywords:error-driven learning   Tibetan syntactic functional chunk   chunk boundary recognition   CRFs   TBL  
本文献已被 CNKI 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号