首页 | 本学科首页   官方微博 | 高级检索  
     

基于混合方法的维吾尔语词干提取方法研究
引用本文:热娜·艾尔肯,李晓,艾尼宛尔·托乎提. 基于混合方法的维吾尔语词干提取方法研究[J]. 计算机应用研究, 2015, 32(1): 112-114,120
作者姓名:热娜·艾尔肯  李晓  艾尼宛尔·托乎提
作者单位:1. 中国科学院新疆理化技术研究所,乌鲁木齐830011;新疆维吾尔自治区标准化研究院,乌鲁木齐830000
2. 中国科学院新疆理化技术研究所,乌鲁木齐,830011
3. 新疆大学新疆多语种实验室,乌鲁木齐,830046
摘    要:针对维吾尔语形态变化,提出了利用规则和词典相结合的混合处理方法进行形态还原技术。利用从左到右地分析和Lovin算法实现了词干提取器。通过总结词法连接规则,提出了规则实现词干提取、用词典验证提取结果。经过对不同新闻内容的五次测试得出平均准确率达到了77.4%。

关 键 词:维吾尔语  形态变化  词干  词缀  规则方法  词典方法  混合方法  Lovin算法

Novel approach for Uyghur stemmer using mixed method
RANA · Arkin,LI Xiao,ANWAR · Tohti. Novel approach for Uyghur stemmer using mixed method[J]. Application Research of Computers, 2015, 32(1): 112-114,120
Authors:RANA · Arkin  LI Xiao  ANWAR · Tohti
Affiliation:RANA·Arkin;LI Xiao;ANWAR·Tohti;Xinjiang Technical Institute of Physics & Chemistry,Chinese Acaderay of Sciences;Xinjiang Institute of Standardization;Key Laboratory of Multilingual Information Technology,Xinjiang University;
Abstract:
Keywords:Uyghur  morphological changes  stem  affixes  rule method  dictionary method  mixed method  Lovin algorithm
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号