首页 | 本学科首页   官方微博 | 高级检索  
     

面向事件的多语平行语料库构建研究
引用本文:张姝 赵铁军 杨沐昀 李生. 面向事件的多语平行语料库构建研究[J]. 计算机应用研究, 2005, 22(11): 23-24,30
作者姓名:张姝 赵铁军 杨沐昀 李生
作者单位:哈尔滨工业大学计算机科学与技术学院,黑龙江哈尔滨150001
基金项目:国家“863”计划资助项目(2002AA117010-09);国家自然科学基金资助项目(60375019)
摘    要:讨论了面向北京奥运的多语语料库建设中的若干基础问题。提出了面向事件、多领域融合的语料收集原则,制定了具有分类信息的标注规范,初步建立了具有近七万句对的可控多语语料库。

关 键 词:语料收集原则  标注规范  可控多语语料库
文章编号:1001-3695(2005)11-0023-02
收稿时间:2004-10-16
修稿时间:2004-10-162004-12-12

Research on Event-Oriented Multiligual Parallel Corpus Construction
ZHANG Shu, ZHAO Tie-jun, YANG Mu-yun, LI Sheng (School of Computer Science. Research on Event-Oriented Multiligual Parallel Corpus Construction[J]. Application Research of Computers, 2005, 22(11): 23-24,30
Authors:ZHANG Shu   ZHAO Tie-jun   YANG Mu-yun   LI Sheng (School of Computer Science
Abstract:Discusses several fundamental problems of muhilingual corpus construction, which oriented Beijing Olympic games, and proposes event-oriented multi-domain fused corpus selection rule, establishes marking guidelines with classification information. A controlled multilingual corpus has been built which contained nearly 70 000 aligned sentence pairs.
Keywords:Corpus Selection Rule   Marking Guidelines   Controlled Multilingual Corpus
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号