排序方式: 共有66条查询结果,搜索用时 15 毫秒
1.
4.
5.
6.
日本和印度几西亚、泰国、中国、马来西亚正在合作开发多国语言机器翻译系统。本文介绍这个项目中的正在研究开发的汉语询典开发辅助系统的词典信息推断功能。
这个项目从1987年开始, 计划用6年时问, 采用中间语言方式, 实现5国语言间的互相翻译, 打算利用本词典开发辅助来统进行编制的汉语词典, 将主要用于这个项目中的汉语分析、汉语生成以及中文输入。
本汉语词典开发辅助系统, 以大量语料为基础, 收集单词, 推断能从例句导出的词典信息, 还可以检验人工完成的词典记述并补充词典信息。本文叙述了从分析大量语料入手, 在提取词典中尚未登录的单词(形态素)的同时, 建立KWIC(上下文中关键词)索引, 并以这种大规模的KWIC为基础, 根据源于连接关系的束缚条件推断语法特征尚不清楚的汉语单词的语法属性的方法 相似文献
7.
中文输入中语法分析技术的应用 总被引:6,自引:4,他引:2
北京大学计算机研究所研制了一种以词和基础的中文语句输入方法。为了减少选择同特征词的麻烦, 输入方法使用了语法分析技术, 取得了一定的效果。本文叙述了方法的梗概、应用语法公式的原理以及加速语法分析的剪枝算法。 相似文献
8.
9.
基于实例的隐喻理解与生成 总被引:1,自引:0,他引:1
语言中的明喻可以看作是带标记的隐喻,比较容易识别,为隐喻的理解和生成提供了很好的知识源.利用web搜索引擎大规模获取明喻实例,自动构建明喻知识库.基于明喻知识库,考察了汉语隐喻的源域分布情况;提出了一个基于实例的隐喻自动理解和生成方法.实验结果表明,隐喻的理解和生成均取得了较高的准确率.该方法具有很好的可扩展性.明喻知识库中所表达的概念之间的组合关系也可以用于其他多种自然语言处理任务. 相似文献
10.
词类标注问题历来受到中文信息处理、汉语语法和词汇学界的共同关注,学者们已提出多种词类标记体系,彼此间存在较大差异,但迄今尚无人对大规模词类标注工程进行系统比较。该文以《现代汉语词典》第5版和《现代汉语语法信息词典》两个大型词典词类标注工程为比较对象,基于所提出的词类对应算法,自动找出两部词典词类标注上的差异,进而对形成差异的原因进行分析。分析结果表明,两部词典词类标注一致性较高(83.5%完全相同),而存在差异的地方可归结为三类主要原因: 词类迁移;词类判断标准不一致;收录义项不同。 相似文献