领域语义语法的统计生成 |
| |
引用本文: | 刘建毅,王菁华,王枞 . 领域语义语法的统计生成[J]. 北京邮电大学学报, 2006, 29(22): 75-78 |
| |
作者姓名: | 刘建毅 王菁华 王枞
|
| |
作者单位: | 1. 北京邮电大学 信息工程学院, 北京 100876; 2. 北京师范大学 中文信息处理研究所, 北京 100875
|
| |
摘 要: | 提出了一个基于统计的从未标注语料库中半自动获取语义语法算法。该算法对特定领域的语料库进行反复的时间聚类和空间聚类,通过时间聚类发现语言片段的语法结构,通过空间聚类发现语言片段的语义类别;循环迭代,可以生成一个粗糙的文法。最后,将这些抽取出来的粗糙文法经过人工校对,从而得到新领域的语义语法。实验结果表明,该方法是有效和切实可行的。
|
关 键 词: | 对话系统 语义语法 K-L距离 互信息 |
收稿时间: | 2006-09-12 |
Statistical Acquisition of Domain-Specific Semantic Grammar |
| |
Affiliation: | 1. School of Information Engineering, Beijing University of Posts and Telecommunications, Beijing 100876, China; 2.Graduate School of Chinese Information Processing, Beijing Normal University, Beijing 100875, China |
| |
Abstract: | |
| |
Keywords: | dialog system semantic grammar kullback-leibler divergence Mutual Information |
|
| 点击此处可从《北京邮电大学学报》浏览原始摘要信息 |
|
点击此处可从《北京邮电大学学报》下载全文 |
|