首页 | 本学科首页   官方微博 | 高级检索  
     

面向韵律层边界自动划分的维吾尔语词性自动标注技术研究
引用本文:努尔比娅·塔依尔,地里木拉提·吐尔逊,艾斯卡尔·肉孜.面向韵律层边界自动划分的维吾尔语词性自动标注技术研究[J].计算机应用与软件,2011,28(8).
作者姓名:努尔比娅·塔依尔  地里木拉提·吐尔逊  艾斯卡尔·肉孜
作者单位:1. 新疆大学信息科学与工程学院,新疆,乌鲁木齐,830046
2. 新疆大学数学与系统科学学院,新疆,乌鲁木齐,830046
基金项目:新疆维吾尔自治区自然科学基金项目(200821125); 新疆大学自然科学基金校院联合项目(XY080101,XY080127)
摘    要:以语音合成系统文本分析模块中的韵律边界自动划分技术为背景,重点研究了维吾尔语词性自动标注技术:首先根据应用领域的特点确定词性的种类及其判定规则,筛选文本句子并对其进行手动词性标注,然后通过统计获得了词性概率表和词性对照表,最后采用基于HMM模型的二元文法来实现维吾尔语词性自动标注。在实验中,为了验证算法的有效性,筛选了10000条句子作为训练样本,另选用500条句子作为测试样本。实验结果表明,该研究思路的可行性和有效性。

关 键 词:维吾尔语  韵律层  词性标注  语音合成  文本分析  

ON TECHNOLOGY OF AUTOMATICALLY TAGGING POS OF UYGHUR SENTENCES ORIENTED TOWARD AUTO-DIVISION OF PROSODIC LAYER BOUNDARY
Nurbiye Tahir,Dilmurat Tursun,Askar Rozi.ON TECHNOLOGY OF AUTOMATICALLY TAGGING POS OF UYGHUR SENTENCES ORIENTED TOWARD AUTO-DIVISION OF PROSODIC LAYER BOUNDARY[J].Computer Applications and Software,2011,28(8).
Authors:Nurbiye Tahir  Dilmurat Tursun  Askar Rozi
Affiliation:Nurbiye Tahir1 Dilmurat Tursun1 Askar Rozi2 1(College of Information Science and Engineering,Xinjiang University,Urumqi 830046,Xinjiang,China) 2(College of Mathematics and System Science,China)
Abstract:An automatic tagging method for POS(part of speech) of Uyghur sentences has been elaborately studied in this paper by taking as the background the automatic division technology on prosodic levels boundary in text analysis module of speech synthesis system.First,according to the characteristics of specific application field,the categories of the POS and their decision rules are confirmed,candidate text sentences are screened out and are manually tagged,and then the probability tables and reference tables of ...
Keywords:Uyghur Prosodic layer POS tagging Speech synthesis Text analysis  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号