首页 | 本学科首页   官方微博 | 高级检索  
     

维吾尔语词缀变体搭配规则研究及算法实现
引用本文:艾孜麦提·艾尼瓦尔,董军,李晓. 维吾尔语词缀变体搭配规则研究及算法实现[J]. 中文信息学报, 2018, 32(11): 27-33
作者姓名:艾孜麦提·艾尼瓦尔  董军  李晓
作者单位:1.中国科学院 新疆理化技术研究所,新疆 乌鲁木齐 830011;
2.中国科学院大学,北京 100049;
3.新疆民族语音语言信息处理实验室,新疆 乌鲁木齐 830012
基金项目:中国科学院关键技术人才项目(Y629431201);中科院西部之光项目(YBXM-2014-04)
摘    要:该文介绍了维吾尔语词干结构特征、词缀结构特征及维吾尔语语音和谐律;以维吾尔语语音和谐律为基础,在充分考虑基本搭配规则和特殊规则的前提下,提出一种基于词干、词缀结构特征的维吾尔语词缀变体搭配算法;验证词干、词缀结构特征提取的正确性和完整性,并对500个名词词干和300个动词词干进行词缀变体搭配,分别生成9 000个名词和37 800个动词。借助维吾尔语文字校对系统和人工验证的方法,对生成的所有单词进行词缀变体搭配准确性验证;实验结果表明,名词和动词词干搭配词缀准确率分别为98.40%和96.49%,整体搭配准确率为96.86%;最后对搭配错误原因进行了分析。

关 键 词:维吾尔语  语音和谐律  词缀变体  变体搭配  结构特征  

Rules and Algorithms for Uyghur Affix Variant Collocation
Aizimaiti Ainiwaer,DONG Jun,LI Xiao. Rules and Algorithms for Uyghur Affix Variant Collocation[J]. Journal of Chinese Information Processing, 2018, 32(11): 27-33
Authors:Aizimaiti Ainiwaer  DONG Jun  LI Xiao
Affiliation:1.The Xinjiang Technical Institute of Physics & Chemistry, Chinese Academy of Sciences, Urumchi, Xinjiang 830011, China;
2.University of Chinese Academy of Sciences, Beijing 100049, China;
3.Xinjiang Laboratory of Minority Speech and Language Information Processing, Urumqi, Xinjiang 830012, China
Abstract:This paper introduces the feature of Uyghur stem structure, affix structure and the Uyghur phonetic harmony. Based on Uyghur phonetic harmony, a Uyghur affix variant collocation algorithm is proposed to cover the basic and special collocation rules. To verify the correctness and completeness of stem and affix structure feature extraction, 500 noun stems and 300 verb stems are generated with affix variants, resulting 9 000 nouns and 37 800 verbs, respectively. The examination results show that the overall accuracy reaches 96.86%, with 98.40% and 96.49% for nouns and verbs, respectively.
Keywords:Uyghur    phonetic harmony    affix variants    variant collocation    structural feature  
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号