排序方式: 共有66条查询结果,搜索用时 93 毫秒
1.
4.
日本和印度几西亚、泰国、中国、马来西亚正在合作开发多国语言机器翻译系统。本文介绍这个项目中的正在研究开发的汉语询典开发辅助系统的词典信息推断功能。
这个项目从1987年开始, 计划用6年时问, 采用中间语言方式, 实现5国语言间的互相翻译, 打算利用本词典开发辅助来统进行编制的汉语词典, 将主要用于这个项目中的汉语分析、汉语生成以及中文输入。
本汉语词典开发辅助系统, 以大量语料为基础, 收集单词, 推断能从例句导出的词典信息, 还可以检验人工完成的词典记述并补充词典信息。本文叙述了从分析大量语料入手, 在提取词典中尚未登录的单词(形态素)的同时, 建立KWIC(上下文中关键词)索引, 并以这种大规模的KWIC为基础, 根据源于连接关系的束缚条件推断语法特征尚不清楚的汉语单词的语法属性的方法 相似文献
5.
统计句法分析建模中基于信息论的特征类型分析 总被引:2,自引:0,他引:2
统计句法分析利用概率评价模型评价每棵选句法树存在的可能性,选择概率值最高的候选句法树作为最终的句法分析结果。因此,统计句法分析的核心是一个概率评价模型,而各种概率评价模型的本质区别主要在于它们分别是根据上下文中的哪些特征来赋予句法树概率的。在统计句法分析研究领域,虽然已经提出了大量的概率评价模型,然而,不同的模型用得到了不同类型的特征,如何评价这些特征类型对于句法分析的作用呢?针对以上的问题,本研究为统计句法分析提出了一种特征类型的分析模型,该模型可以从信息论的角度量化地分析不同类型的上下文特征对于句法结构的预测作用。其基本思想是利用信息论中熵与条件熵的度量来显示一个特征类型是否抓住了预测句法结构的主要信息。如果加入某个特征类型之后当前句法结构的不确定性(熵)明显下降,则认为该特征类型抓住了上下文中影响句法结构的某些主要信息。特征类型分析的信息论模型利用预测信息量、预测信息增益、预测信息关联度以及预测信息总量四种度量从不同的仙量化地分析各种特征类型及特征类型组合对于当前目标的预测作用。实验以Penn TreeBank为训练集,将上下文中不同的特征类型对于句法分析规则的预测作用进行了系统的量化分析,得出了一系列有关不同特征类型及特征类型组合对句法结构的预测作用的结论。 相似文献
6.
7.
中文输入中语法分析技术的应用 总被引:6,自引:4,他引:2
北京大学计算机研究所研制了一种以词和基础的中文语句输入方法。为了减少选择同特征词的麻烦, 输入方法使用了语法分析技术, 取得了一定的效果。本文叙述了方法的梗概、应用语法公式的原理以及加速语法分析的剪枝算法。 相似文献
8.
9.
面向EBMT的汉语单句谓语中心词识别研究 总被引:9,自引:3,他引:9
在基于实例的汉英机器翻译( EBMT) 系统中,为计算语句相似度,需要对句子进行适当的分析。本文首先提出了一种折中的汉语句子分析方法———骨架依存分析法,通过确定谓语中心词来把握句子的整体结构,然后,提出了一种根据汉英例句集中英语例句的谓语中心词来识别相应的汉语例句的谓语中心词的策略。实验结果是令人满意的。 相似文献
10.