首页 | 本学科首页   官方微博 | 高级检索  
     

维吾尔语多音词消歧混合方法
引用本文:姑丽加玛丽·麦麦提艾力,艾斯卡尔·肉孜,艾斯卡尔·艾木都拉. 维吾尔语多音词消歧混合方法[J]. 计算机工程与应用, 2011, 35(35): 158-160
作者姓名:姑丽加玛丽·麦麦提艾力  艾斯卡尔·肉孜  艾斯卡尔·艾木都拉
作者单位:1. 新疆大学信息科学与工程学院,乌鲁木齐,830046
2. 新疆大学数学与系统科学学院,乌鲁木齐,830046
基金项目:国家自然科学基金(No.61065005,No.61062008); 新疆维吾尔自治区多语种信息技术实验室开放项目(No.XJDX0905)~~
摘    要:维吾尔语中存在的形同音不同单词(多音词)的正确发音是影响合成系统可懂读的重要原因之一。维吾尔语单词由词根和词缀构成,虽然多音词词根数量不多,但多音词词根连接各种词缀则构成了大量的多音词。将维吾尔语中经常用错的16个多音词词根作为研究对象,以多音词的不同特点为出发点,采取不同的规则,结合最大熵模型方法来处理不符规则的多音词,同时用似然比方法选取关键词,并用贪婪算法选择最佳特征模板。经过性能测试,该算法多音词消歧平均准确率达到87.7%。

关 键 词:维吾尔语  多音词  最大熵模型
修稿时间: 

Hybrid algorithm of polyphonic word disambiguation in Uyghur language
Guljamal Mamateli , Askar Rozi , Askar Hamdulla. Hybrid algorithm of polyphonic word disambiguation in Uyghur language[J]. Computer Engineering and Applications, 2011, 35(35): 158-160
Authors:Guljamal Mamateli    Askar Rozi    Askar Hamdulla
Affiliation:Guljamal Mamateli1,Askar,Rozi2,Askar Hamdulla1 1.Institute of Information Science and Engineering,Xinjiang University,Urumqi 830046,China 2.Institute of Mathematics and System Science,China
Abstract:The correct pronunciation of polyphonic word is one of the important factors that affect the Uyghur speech synthesis intelligibility.A word consists of stem and affix in Uyghur language,although there is a few polyphone stems,but a large number of polyphonic words are constituted by jointing of affix and polyphonic stem.This paper selects 16 polyphonic stems which are frequently used and often read wrong in Uyghur language to study,presents a different rule based method and adopts the maximum entropy model ...
Keywords:Uyghur language  polyphonic word  maximum entropy model
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程与应用》浏览原始摘要信息
点击此处可从《计算机工程与应用》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号