排序方式: 共有13条查询结果,搜索用时 15 毫秒
1.
作为一种重要的短语类型,介词短语在汉语中分布广泛,正确识别汉语介词短语对自然语言处理领域的很多任务和应用都有重要的作用和意义。该文对近些年与识别汉语介词短语有关的研究做了梳理,从研究对象、实验评价标准和具体研究方法等几个方面比较详细地介绍了相关工作,最后归纳了汉语介词短语识别研究中表现出来的一些特点,并对未来研究的发展提出了几点建议。 相似文献
2.
3.
兼类词在汉语专利语料中分布普遍。面向汉英专利机器翻译提出了一种基于规则的动-介兼类词识别方法。根据边界感知原则和兼类词的句法语义属性以及周围的语境信息,设计了一系列兼类排歧规则,同时分别提出了兼类词识别为动词或介词的策略,并以形式化的规则加以描述。相关实验测试表明提出的方法可以有效地识别动-介兼类词语,对改善翻译系统的翻译结果也有帮助。 相似文献
4.
为了获得全局最优的高质量层次聚类结果,针对智能蚁群优化算法改进凝聚层次聚类算法,以获得高质量的层次聚类结果,提出一种新的基于蚁群优化和凝聚层次聚类的混合聚类方法.该方法使用改进的凝聚层次聚类算法和新的目标函数生成聚类的系统树图,利用内部指标评估解决方案,用智能蚁群优化算法支持的信息素反馈和信息素挥发机制控制蚁群在解决方案空间中的搜索.由于使用了元启发式优化,加快了搜索过程,避免了局部最优.在加州大学欧文分校多个数据集上的实验结果表明,新方法具备一定的可行性. 相似文献
5.
We introduce a novel Semantic-Category-Tree (SCT) model to present the semantic structure of a sentence for Chinese-English Machine Translation (MT). We use the SCT model to handle the reordering in a hi-erarchical structure in which one reordering is depend-ent on the others. Different from other reordering ap-proaches, we handle the reordering at three levels: sen-tence level, chunk level, and word level. The chunk-lev-el reordering is dependent on the sentence-level reorde-ring, and the word-level reordering is dependent on the chunk-level reordering. In this paper, we formally de-scribe the SCT model and discuss the translation strate-gy based on the SCT model. Further, we present an al-gorithm for analyzing the source language in SCT and transforming the source SCT into the target SCT. We apply the SCT model to a rule-based patent text MT to evaluate the ability of the SCT model. The experimental results show that SCT is efficient in handling the hierar-chical reordering operation in MT. 相似文献
6.
格式在HNC理论中是指广义作用句各主语块位置的不同排列组合方式。由于主语块的排列方式在汉英两种语言中表达的差异,汉语句子翻译到英语时常常发生格式转换。格式转换是HNC机器翻译理论的一个重要内容,是机器翻译理论实践的基础和前提。以HNC机器翻译理论为指导,以真实文本的专利文献汉英句对为分析对象,研究专利机器翻译中汉英两种语言之间广义作用句的格式转换规律,制定了排除规则、识别规则和转换规则,对部分规则进行了人工评测,结果表明准确率能达到85%左右。 相似文献
7.
一个基于语境框架的文本特征提取算法 总被引:14,自引:0,他引:14
介绍了一种新的文本语义形式化模型——语境框架。语境框架是一个三维的语义描述,它把文本内容抽象成领域(静态范畴)、情景(动态描述)、背景(褒贬、参照等)3个框架。在语境框架的基础上,设计实现了文本特征提取算法。算法从语义入手,实现了4元组表示的领域提取算法、以领域句类为核心的情景提取算法和以对象语义立场网络图为基础的褒贬判断。算法可以有效地处理语言中的褒贬倾向、同义、多义等现象,实际应用中表明具有很好的信息抽取能力。 相似文献
8.
基于语境框架的文本相似度计算 总被引:12,自引:0,他引:12
晋耀红 《计算机工程与应用》2004,40(16):36-39
介绍了一种新的文本形式化的语义模型———语境框架。语境框架是一个三维的语义描述,它把文本内容抽象成领域(静态范畴)、情景(动态描述)、背景(褒贬、参照等)三个侧面。在语境框架的基础上,设计实现了文本相似度计算算法。算法从概念层面入手,充分考虑了文本的领域和对象的语义角色对相似度的影响,重点针对文本中的歧义、多义、概念组合现象,以及语言中的褒贬倾向,实现了文本间语义相似程度的量化。算法已经应用到文本过滤系统中,用以比较用户过滤要求和待过滤文本之间的相似度。实际应用中取得了比较满意的效果。 相似文献
9.
针对专利文本翻译中长句翻译的问题,提出了一种句子切分算法,即把长句切分成多个独立的小句后再进行翻译的方法。切分算法使用了概念层次网络(HNC)理论的语义特征来切分小句,切分算法和一个基于规则的基线翻译系统进行了融合,融合后的翻译系统的BLEU值达到0189 8,比融合前的系统提高了30%。实验结果证明,提出的方法可以有效地改进专利翻译效果。 相似文献
10.