首页 | 本学科首页   官方微博 | 高级检索  
     

维吾尔语的N-gram语言模型研究
引用本文:张亚军. 维吾尔语的N-gram语言模型研究[J]. 数字社区&智能家居, 2011, 0(17)
作者姓名:张亚军
作者单位:昌吉学院;
摘    要:针对基于维吾尔语的N-gram模型统计数据稀疏问题造成统计模型识别性能降低,研究针对政府文献和报告领域的语料进行了1到3元文法统计,采用加法、线性插值、Witten-Bell和Kneser-Ney平滑算法进行了约束。结果表明,本实验中Kneser-Ney平滑技术可以大大降低统计维吾尔语的N-gram模型的困惑度。

关 键 词:语言模型  平滑算法  困惑度  维吾尔语-汉语双语语料  

Research of Uyghur N-gram Model
ZHANG Ya-jun. Research of Uyghur N-gram Model[J]. Digital Community & Smart Home, 2011, 0(17)
Authors:ZHANG Ya-jun
Affiliation:ZHANG Ya-jun (Changji College,Changji 831100,China)
Abstract:
Keywords:language model  smoothing algorithm  perplexity  Uyghur language & Chinese parallel corpus  
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号