首页 | 本学科首页   官方微博 | 高级检索  
     

基于多策略的乌孜别克语名词词干识别研究
引用本文:艾孜海尔江,祖力克尔江,艾孜尔古丽,玉素甫·艾白都拉. 基于多策略的乌孜别克语名词词干识别研究[J]. 中文信息学报, 2018, 32(9): 35-40
作者姓名:艾孜海尔江  祖力克尔江  艾孜尔古丽  玉素甫·艾白都拉
作者单位:1.新疆师范大学 计算机科学技术学院,新疆 乌鲁木齐 830054;
2.新疆师范大学 文学院,新疆 乌鲁木齐 830054
基金项目:国家语委重点项目(ZD1135-28);国家自然科学基金(6186020472,61662081);新疆维吾尔自治区自然科学基金(2017D01A58);新疆维吾尔自治区青年科技创新人才培养工程(QN2016BS0365);国家社会科学基金(14AZD11);新疆维吾尔自治区社会科学基金(2016CYY067);国家语言资源监测与研究中心少数民族语言分中心项目(NMLR201602);新疆师范大学计算机应用重点学科、新疆师范大学数据安全重点实验室资助项目
摘    要:乌孜别克语名词词干识别是自然语言处理领域的基础研究,主要方法是从句子中提取名词词干,提高名词标注效率和准确性。该文首先陈述形态分析、形态特征对识别其词性的作用,然后讨论乌孜别克语的词类划分标准、名词的形态特征,乌孜别克语西尔里文转换拉丁文,乌孜别克语词汇翻译、标注技术,总结词缀歧义及消解规则。该文提出利用形态规则、词典、最大熵融合策略,设计现代乌孜别克语新词中名词词干识别算法,其中包括特征选择及参数估计、词内部特征、前后依存词特征等。最后以乌孜别克语网站文本作为验证对象,对名词词干进行统计与分析。

关 键 词:乌孜别克语  形态分析  多策略  名词词干识别  

Study on Recognition of Uzbek Noun Stems Based on Multi-strategy
Azhar,Zulkar,Azragul,Yusup Abaydula. Study on Recognition of Uzbek Noun Stems Based on Multi-strategy[J]. Journal of Chinese Information Processing, 2018, 32(9): 35-40
Authors:Azhar  Zulkar  Azragul  Yusup Abaydula
Affiliation:1.School of Computer Science and Technology, Xinjiang Normal University, Urumqi, Xinjiang 830054, China;
2.College of Arts, Xinjiang Normal University, Urumqi, Xinjiang 830054, China
Abstract:Uzbek language noun stems recognition is aimed at extracting noun stems from the sentence, thereby improving the efficiency of nouns recognition. We first discuss the classification of part-of-speech of Uzbek words and the morphological analysis of nouns, summarizing the affix and ambiguity resolution rules in Uzbek language. Then we put forward the algorithm for Uzbek new nouns recognition, include the internal features, the feature selection, the parameter estimation, and the word dependency features. Taking the Uzbek Web text as test object, the noun stems are finally identified with additional statistical analysis.
Keywords:Uzbek language    morphological analysis    multi-strategy    noun stems recognition  
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号