首页 | 本学科首页   官方微博 | 高级检索  
     

语言信息处理技术中的最大熵模型方法
引用本文:李素建,刘群,张志勇,程学旗.语言信息处理技术中的最大熵模型方法[J].计算机科学,2002,29(7):108-110.
作者姓名:李素建  刘群  张志勇  程学旗
作者单位:中国科学院计算技术研究所,北京,100080
摘    要:1 引言进行汉语处理时经常遇到的问题有:分词、词性标注、语法和语义分析等等。这些自然语言中的问题都可以形式化为分类问题,估计某一类y在上下文x中发生的概率,即p(y,x)。在汉语中上下文x的内容可以包括汉字、词、词性等,对于不同的任务上下文的内容也不同。这类问题可以采用统计建模的方法去处理。首先是采集大量样本进行训练,样本代表了该任务的知识和信息,选取样本的好坏确定了知识完整性的程度。然后建立一个统计模型,并把样本知识结合到模型中,来预测随机过程将来的行为。

关 键 词:语言信息处理  最大熵模型  汉语信息处理  自然语言处理  语义分析

Method of Maximum Entropy Model for Language Processing
Abstract:
Keywords:
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号