首页 | 本学科首页   官方微博 | 高级检索  
     

基于主题的汉语语言模型的研究
引用本文:曲卫民,张俊林,孙乐. 基于主题的汉语语言模型的研究[J]. 计算机研究与发展, 2003, 40(9): 1368-1374
作者姓名:曲卫民  张俊林  孙乐
作者单位:中国科学院软件研究所系统软件与中文信息中心,北京,100080
基金项目:国家自然科学基金(60203007);国家"八六三"高技术研究发展计划重大项目基金(2001AA114040)
摘    要:基于主题的自适应语言模型能有效地解决语言模型跨主题应用的问题,针对其面临的两个主要问题——语料的分类和各语言模型的融合,采用了一种新的语料分类算法,突破了原有分类方法的一些局限性,并提出了一种改进的融合各语言模型的方法:概率 线性插值法,该方法既改善了语言模型的性能,又提高了横型的运算效率。

关 键 词:语言模型 自适应 主题 分类

Research on a Topic-Based Chinese Language Model
QU Wei Min,ZHANG Jun Lin,and SUN Le. Research on a Topic-Based Chinese Language Model[J]. Journal of Computer Research and Development, 2003, 40(9): 1368-1374
Authors:QU Wei Min  ZHANG Jun Lin  and SUN Le
Abstract:A topic based language model effectively solves the problem of cross domain application of a statistical language model There exist two questions, how to cluster the corpus to different topics and how to combine the topic specific language models First, a new method is adopted to cluster the corpus that has overcome some limitations of the old one Second, an improved algorithm is proposed to combine different language models Not only has the new method improved the performance, but also accelerated the model
Keywords:language model  adaptive  topic based  cluster
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号