期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

李洪政晋耀红《中文信息学报》2017,31(2):1-10

作为一种重要的短语类型,介词短语在汉语中分布广泛,正确识别汉语介词短语对自然语言处理领域的很多任务和应用都有重要的作用和意义。该文对近些年与识别汉语介词短语有关的研究做了梳理,从研究对象、实验评价标准和具体研究方法等几个方面比较详细地介绍了相关工作,最后归纳了汉语介词短语识别研究中表现出来的一些特点,并对未来研究的发展提出了几点建议。相似文献

2.

基于模板的汉英专利机器翻译研究

张冬梅刘小蝶晋耀红《计算机应用研究》2013,30(7):2044-2046

为了改善专利文献的机器翻译效果, 提出了一种基于模板的机器翻译方法。通过分析汉英双语对齐的专利文献语料, 人工书写了600余条模板, 模板的设计思想源于弱化的正则文法; 设计和实现了一个模板翻译模块, 并将其与已有的一个基于规则的机器翻译系统相融合。实验结果表明, 40%以上的测试文本的翻译质量得到了提高, 因此, 这种基于模板的方法对于改善专利文献的机器翻译效果是有效的。相似文献

3.

汉英专利机器翻译中动-介兼类词自动识别

李洪政朱筠晋耀红《计算机工程与应用》2015,51(11):6-11

兼类词在汉语专利语料中分布普遍。面向汉英专利机器翻译提出了一种基于规则的动-介兼类词识别方法。根据边界感知原则和兼类词的句法语义属性以及周围的语境信息,设计了一系列兼类排歧规则,同时分别提出了兼类词识别为动词或介词的策略,并以形式化的规则加以描述。相关实验测试表明提出的方法可以有效地识别动-介兼类词语,对改善翻译系统的翻译结果也有帮助。相似文献

4.

使用蚁群优化和凝聚层次的混合聚类

熊文晋耀红《北京邮电大学学报》2013,36(3):60-63,78

为了获得全局最优的高质量层次聚类结果,针对智能蚁群优化算法改进凝聚层次聚类算法,以获得高质量的层次聚类结果,提出一种新的基于蚁群优化和凝聚层次聚类的混合聚类方法.该方法使用改进的凝聚层次聚类算法和新的目标函数生成聚类的系统树图,利用内部指标评估解决方案,用智能蚁群优化算法支持的信息素反馈和信息素挥发机制控制蚁群在解决方案空间中的搜索.由于使用了元启发式优化,加快了搜索过程,避免了局部最优.在加州大学欧文分校多个数据集上的实验结果表明,新方法具备一定的可行性. 相似文献

5.

层次语义类型树模型及其在汉英机器翻译中的应用

下载免费PDF全文

朱小健晋耀红《中国通信》2012,9(12):80-92

We introduce a novel Semantic-Category-Tree (SCT) model to present the semantic structure of a sentence for Chinese-English Machine Translation (MT). We use the SCT model to handle the reordering in a hi-erarchical structure in which one reordering is depend-ent on the others. Different from other reordering ap-proaches, we handle the reordering at three levels: sen-tence level, chunk level, and word level. The chunk-lev-el reordering is dependent on the sentence-level reorde-ring, and the word-level reordering is dependent on the chunk-level reordering. In this paper, we formally de-scribe the SCT model and discuss the translation strate-gy based on the SCT model. Further, we present an al-gorithm for analyzing the source language in SCT and transforming the source SCT into the target SCT. We apply the SCT model to a rule-based patent text MT to evaluate the ability of the SCT model. The experimental results show that SCT is efficient in handling the hierar-chical reordering operation in MT. 相似文献

6.

汉英机器翻译中格式转换研究

刘智颖郭艳波晋耀红《计算机工程与应用》2014,50(6):192-196

格式在HNC理论中是指广义作用句各主语块位置的不同排列组合方式。由于主语块的排列方式在汉英两种语言中表达的差异,汉语句子翻译到英语时常常发生格式转换。格式转换是HNC机器翻译理论的一个重要内容,是机器翻译理论实践的基础和前提。以HNC机器翻译理论为指导,以真实文本的专利文献汉英句对为分析对象,研究专利机器翻译中汉英两种语言之间广义作用句的格式转换规律,制定了排除规则、识别规则和转换规则,对部分规则进行了人工评测,结果表明准确率能达到85%左右。相似文献

7.

一个基于语境框架的文本特征提取算法 总被引：14，自引：0，他引：14

晋耀红苗传江《计算机研究与发展》2004,41(4):582-586

介绍了一种新的文本语义形式化模型——语境框架。语境框架是一个三维的语义描述，它把文本内容抽象成领域(静态范畴)、情景(动态描述)、背景(褒贬、参照等)3个框架。在语境框架的基础上，设计实现了文本特征提取算法。算法从语义入手，实现了4元组表示的领域提取算法、以领域句类为核心的情景提取算法和以对象语义立场网络图为基础的褒贬判断。算法可以有效地处理语言中的褒贬倾向、同义、多义等现象，实际应用中表明具有很好的信息抽取能力。相似文献

8.

基于语境框架的文本相似度计算 总被引：12，自引：0，他引：12

晋耀红《计算机工程与应用》2004,40(16):36-39

介绍了一种新的文本形式化的语义模型———语境框架。语境框架是一个三维的语义描述,它把文本内容抽象成领域(静态范畴)、情景(动态描述)、背景(褒贬、参照等)三个侧面。在语境框架的基础上,设计实现了文本相似度计算算法。算法从概念层面入手,充分考虑了文本的领域和对象的语义角色对相似度的影响,重点针对文本中的歧义、多义、概念组合现象,以及语言中的褒贬倾向,实现了文本间语义相似程度的量化。算法已经应用到文本过滤系统中,用以比较用户过滤要求和待过滤文本之间的相似度。实际应用中取得了比较满意的效果。相似文献

9.

专利文本翻译中复杂长句翻译算法研究*

晋耀红《计算机应用研究》2011,28(8):2893-2896

针对专利文本翻译中长句翻译的问题,提出了一种句子切分算法,即把长句切分成多个独立的小句后再进行翻译的方法。切分算法使用了概念层次网络（HNC）理论的语义特征来切分小句,切分算法和一个基于规则的基线翻译系统进行了融合,融合后的翻译系统的BLEU值达到0189 8,比融合前的系统提高了30%。实验结果证明,提出的方法可以有效地改进专利翻译效果。相似文献

10.

基于概念层次网络的知识表示与本体建模

文亮李娟刘智颖晋耀红《中文信息学报》2018,32(4):66-73

知识表示是自然语言理解的重要基础。知识表示不统一、语义信息无法系统化利用是目前存在的亟待解决的问题。要解决这个问题,就要解决语义知识表示的问题。该文基于概念层次网络,描述了词语、句子和篇章层面的语义知识表示方法。基于文中描述的词汇层面的表示方法,构建了一个多语言本体知识库。该知识库的知识表示方法不仅可以为知识表示理论研究提供基础,还可以为自然语言处理相关领域的应用提供资源支持。相似文献