首页 | 本学科首页   官方微博 | 高级检索  
     

基于上下文的拉丁维文拼写校对的研究
引用本文:何晋一,陈红英,姜文斌,张海波,刘群.基于上下文的拉丁维文拼写校对的研究[J].计算机系统应用,2011,20(12):60-63.
作者姓名:何晋一  陈红英  姜文斌  张海波  刘群
作者单位:1. 华南师范大学计算机学院,广州510631;中国科学院计算技术研究所智能信息处理重点实验室,北京100190
2. 华南师范大学计算机学院,广州,510631
3. 中国科学院计算技术研究所智能信息处理重点实验室,北京,100190
4. 中国科学院计算技术研究所智能信息处理重点实验室,北京100190; 四川大学软件学院,成都610065
摘    要:根据拉丁维文的特点,分析了拉丁维文常见的拼写错误类型,提出了一种将最小编辑距离、基于有向图模型的词语切分和trigram语言模型融合的方法,实现了基于上下文的拉丁维文的自动拼写校对系统,从而大大提高了拉丁维文的校对准确率.在新疆大学提供的维文语料库的测试中,拉丁维文的校对准确率达到了90.1%.

关 键 词:拉丁维文  最小编辑距离  有向图模型  词语切分  语言模型  上下文  拼写校对
收稿时间:2011/3/29 0:00:00
修稿时间:5/4/2011 12:00:00 AM

Latin-Uighur Spelling Check Based on Context
HE Jin-Yi,CHEN Hong-Ying,JIANG Wen-Bin,ZHANG Hai-Bo and LIU Qun.Latin-Uighur Spelling Check Based on Context[J].Computer Systems& Applications,2011,20(12):60-63.
Authors:HE Jin-Yi  CHEN Hong-Ying  JIANG Wen-Bin  ZHANG Hai-Bo and LIU Qun
Affiliation:HE Jin-Yi1,2,CHEN Hong-Ying1,JIANG Wen-Bin2,ZHANG Hai-Bo2,3,LIU Qun2 1(School of Computer,South China Normal University,Guangzhou 510631,China) 2(Key Laboratory of Intelligent Information Processing,Institute of Computing Technology,Chinese Academy of Sciences,Beijing 100190,China) 3(School of Software Engineering,Sichuan University,Chengdu 610065,China)
Abstract:According to the characteristics of Latin-Uighur,this paper analyzed the common spelling error types of Latin-Uighur,and then proposed a method which merged the minimum edit distance,directed graph model based lexical segmentation,trigram language model together.Finally,we implemented the automatically spelling check system of Latin-Uighur based on context.It has increased the accuracy of Latin-Uighur spelling check largely.The experiment on the Uighur corpus provided by Xinjiang University reaches an accur...
Keywords:Latin-Uighur  minimum edit distance  directed graph model  lexical segmentation  language model  context  spelling check  
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机系统应用》浏览原始摘要信息
点击此处可从《计算机系统应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号