首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
汉维哈柯双语平行语料库是建设综合型语言知识库的有机组成部分,又是基于实例的机器翻译系统的基础。因为双语语料库中包含了两种语言互译信息特征,能够提供两种语言之间丰富的匹配信息,所以不仅在机器翻译、双语词典编纂等领域起到关键作用,而且在双语教学、跨语言文献检索等领域都有着广泛的应用前景。建设语料库的传统工艺流程繁琐、费时、耗力难以适应语言信息的变化速度,因此汉维哈柯双语平行语料库加工处理系统的实现对语料库的建设具有重要的作用。  相似文献   

2.
为了提高传统翻译系统翻译质量,提出一种基于多译本平行语料库的英汉智能翻译系统。为实现该系统,首先采用网络爬虫算法对英汉语料进行收集和预处理,搭建出多译本平行语料库;然后采用基于上下文向量的词对齐模型和基于余弦相似度计算方式的段落对齐模型作为系统模型,并构建出基于attention注意力机制-LSTM的翻译系统,最后与基于跨语言词向量和基于IBM模型1的词对齐模型进行对比实验。实验结果表明,三种模型中基于上下文向量的词对齐模型正确率高达90.24%,而其余两种模型正确率仅为62.71%和51.06%,可以证明基于多译本平行语料库的英汉智能翻译系统可以有效提升翻译的正确率,达到了预期的翻译效果,可以运用于英汉智能翻译的工作中。  相似文献   

3.
汉英篇章结构平行语料库是为汉英翻译文本标注对齐篇章结构信息的语料库,对齐标注是其核心工作,基本原则是“结构对齐、关系对齐”。该文基于所开发的对齐标注平台,进行人工对齐标注实验,提出切分对齐、结构对齐、关系对齐、连接词对齐、关系角色与中心对齐等对齐标注任务的评估方法,并给出评估分析。实验表明,对齐标注是构建汉英篇章结构平行语料库的合理、有效工作方式。  相似文献   

4.
平行语料库处理初探:一种排序模型   总被引:1,自引:0,他引:1  
十年来,统计方法在机器翻译中的应用得到了广泛的关注,并逐渐成为机器翻译研究的主流方法.构造高质量统计机器翻译系统的重要基础是大规模高质量的双语平行语料库.目前,多数平行语料库包含着错误或噪音,它们极大影响着统计机器翻译系统的性能.用人工手段来筛选语料库中的句对是费时费力的,本文研究了一种有助于处理这一问题排序模型,该模型考虑了多方面的因素,包括语言模型、长度信息、意义对应等.鉴于如今的统计机器翻译系统都依赖词对齐信息,词对齐因素也被考虑入本模型中.文章最后的实验及结果表明本模型具有较好的性能.  相似文献   

5.
篇章结构平行语料库是对具有对译关系的双语文本标注了平行篇章结构信息的语料库。对齐标注是汉英篇章结构平行语料库的核心理论基础。该文提出“结构对齐,关系对齐”的对齐标注策略,应用于切分对齐、层次结构对齐、关系对齐、中心对齐等环节,实现了对齐和标注并行、单位对齐和结构对齐共进的平行语料库工作模式。本策略辅之以相应标注平台和工作程序以及相应难点解决方案,被证明是一种高效的篇章结构平行语料库工作方式。  相似文献   

6.
建立手语汉语平行语料库的目的是用于机器翻译和语言对比研究,并且能够系统地保存手语资源,保护手语和聋人文化。手语汉语平行语料库存储的内容主要包括手语视频、被采集者信息和标注者信息,以及通过多媒体标注软件ELAN转写的十四层标注信息,包括手控和非手控信息。该文采用基于向量空间的余弦相似性算法,实现了用手语语料相似度的计算来帮助语料库去重,并取得了较明显的效果;同时用此算法进行专家相似度测试以确保语料库的质量。  相似文献   

7.
双语语料库自动对齐是自然语言处理的一个重要研究课题。针对基于词典的英汉双语句子对齐算法存在的缺点,提出了基于词典和相对位置高效英汉对齐算法,该算法在多数情况下具有较高的准确率,效率比传统算法好,通过理论的分析和实验对比可知,该算法是可行的。  相似文献   

8.
作为一项重要的基础资源,双语平行语料库在人工智能领域的研究起着举足轻重的作用。我国涉及少数民族语言的双语语料库的探索工作相对较少,本文介绍了汉维双语语料库的建立过程,并对语料的收集整理和组织做了初步的设想。  相似文献   

9.
双语语料库自动对齐是自然语言处理的一个重要研究课题。针对基于词典的英汉双语句子对齐算法存在的缺点,提出了基于词典和相对位置高效英汉对齐算法,该算法在多数情况下具有较高的准确率,效率比传统算法好,通过理论的分析和实验对比可知,该算法是可行的。  相似文献   

10.
主要介绍了开发制作的汉藏平行语料库系统的特点、功能,以及系统的设计思想和总体框架。系统以藏区使用的小学和初中汉语教材的内容为生语料,实现了改进的B+树索引、词表生成、词语搭配分析、汉藏双语检索、朗读和对齐等功能,为少数民族地区的汉语教学、信息挖掘和自然语言处理等方面的研究提供了丰富而真实的语言环境。  相似文献   

11.
In conventional algorithms, the lack of entity information, reference, and semantic relations in the current corpus leads to a low rate of precision and efficiency in constructing cross‐language bilingual mapping. According to natural language processing and machine translation technology, to solve the problem, this paper aims to establish a parallel corpus for information extraction based on the OntoNotes corpus by combining automatic extraction and manual adjustment. To verify the validity of the parallel corpus constructed in this paper, a comparative experiment was carried out on the corpus. The corpus entity alignment rate, anaphora absence, and syntactic structure were analysed in detail based on statistics. The data set is well performed in language processing and machine translation. The parallel corpus for information extraction constructed in this paper can produce highly precise, stable, and efficient information in the process of bilingual mapping, which provides an effective parallel corpus for the study in machine translation of bilingual mapping.  相似文献   

12.
在水下目标检测和跟踪系统中,多目标检测算法起着重要的作用,AIC算法是最具代表性的方法。为了满足目标检测对高速实时并行处理技术的要求,针对水下阵列信号处理的实际应用,采用有效的并行算法和并行结构来减少运算量,设计并研制了一种基于4片ADSP-TS101S的多处理器并行实时处理系统。经过对算法的运算时间和目标检测的性能进行分析,表明该系统提高了处理效率,解决了阵列信号处理中大运算量的高速实时处理的问题,具有良好的目标检测性能和实时处理能力,满足工程实际需求。  相似文献   

13.
李锡武  毛先俊 《计算机工程与设计》2007,28(21):5183-5185,5240
随着超大规模集成电路技术的发展,数字信号处理器的处理能力不断提高.介绍系统软件运行的硬件平台及功能,描述系统硬件的软件接口技术及其实现方法,设计并实现了一个基于VME总线技术.采用Link口互联的DSP 21160N并行软件系统,对系统性能进行测试与分析,结果表明,该并行软件系统能够满足设计要求.最后对系统的研究和实际工作做出总结.  相似文献   

14.
俞凌云  王毅刚  王亢 《计算机应用》2008,28(9):2434-2436
在开放源码的三维绘制引擎OpenSceneGraph和Windows视频显示平台Direct Show的基础上,结合大屏幕投影的应用特点,利用一个通过网络连接的PC集群机组,开发了无缝拼接的三维渲染和视频播放大屏幕投影系统的软件平台,使之既可以用来观看各种格式的大屏幕电影,也可以交互浏览各种格式的三维虚拟场景。设计了主机/从机系统架构思想,利用OSG技术加载几何场景和视频,并提出在保留和立即两种模式下的同步控制技术——时间同步和帧同步。实践证明该方法效果理想,投入成本低,易于操作。  相似文献   

15.
针对在中文资源的关系抽取中,由于中文长句句式复杂,句法特征提取难度大、准确度低等问题,提出了一种基于平行语料库的双语协同中文关系抽取方法。首先在中英双语平行语料库中的英文语料上利用英文成熟的句法分析工具,将得到依存句法特征用于英文关系抽取分类器的训练,然后与利用适合中文的n-gram特征在中文语料上训练的中文关系抽取分类器构成双语视图,最后再依靠标注映射后的平行语料库,将彼此高可靠性的语料加入对方训练语料进行双语协同训练,最终得到一个性能更好的中文关系抽取分类模型。通过对中文测试语料进行实验,结果表明该方法提高了基于弱监督方法的中文关系抽取性能,其F值提高了3.9个百分点。  相似文献   

16.
并行应用软件系统移植是应用巨型机、更早发挥巨型机性能的更快捷、更经济的一种技术途径,同时又是比较复杂、难度较大的任务。针对基于MPI并行环境的并行应用软件系统的移植,提出了“包装”MPI的一种解决方案。实践证明,该方法简单、高效,并可推广至基于PVM环境的并行应用软件系统的移植工作中。  相似文献   

17.
在结构静强度试验过程中,加载控制系统是试验载荷施加的关键控制机构,加载控制系统输出的加载数据将直接反应试验件载荷受力情况。目前MOOG加载控制系统提供的数据输出格式不具有较直观的阅读性,增加了试验人员对加载数据处理的难度。为此本文提出了一种基于LabVIEW的软件设计方法,对MOOG原始加载数据进行二次处理,并转换为常用的数据格式,实现加载控制通道相对误差的自动计算,并自动生成加载控制数据报告。该软件设计方法在大幅降低试验人员处理数据难度的同时缩短了试验数据处理周期。在提高了工作效率的基础上,减少了人工操作的出错率,有助于飞机结构强度试验的数据分析工作。  相似文献   

18.
传统的并行处理控制系统在处理存储器中易失性用户大数据时,对CPU的利用率很低,导致处理控制工作精密度差。为了解决此问题,设计了一种新的大数据并行处理控制系统,分别对系统的硬件和软件进行设计,分析了控制系统中各组件的结构关系,重点设计了系统总线、中央处理器;软件部分分为打开文件、更新文件、监测运行、数据连接四步。为了检测系统的可行性,与传统并行处理控制系统进行实验对比,结果显示,设计的并行处理控制系统能够充足的利用系统CPU,精确地处理存储器中易失性用户大数据。该系统具有超强的工作能力,值得推广使用。  相似文献   

19.
A low cost, high-speed, general-purpose ditigal signal processing system was constructed using the TMS32010 digital signal processor. The system was designed with simplicity, compactness, flexibility and expandibility in mind. A parallel processing architecture was adopted to achieve realtime performance. Four processors were used in the prototype system, but this can be expanded easily. Interprocessor data transfer and communications with the host computer are facilitated via a single common bus and a bank of shared memory. A one-dimensional digital FIR filter and a realtime FFT program were used to evaluate the performance of the system. In addition, a realtime spectrogram was implemented as an application example.  相似文献   

20.
除了机器翻译,平行语料库对信息检索、信息抽取及知识获取等研究领域具有重要的作用,但是传统的平行语料库只是在句子级对齐,因而对跨语言自然语言处理研究的作用有限。鉴于此,以OntoNotes中英文平行语料库为基础,通过自动抽取、自动映射加人工标注相结合的方法,构建了一个面向信息抽取的高质量中英文平行语料库。该语料库不仅包含中英文实体及其相互关系,而且实现了中英文在实体和关系级别上的对齐。因此,该语料库将有助于中英文信息抽取的对比研究,揭示不同语言在语义表达上的差异,也为跨语言信息抽取的研究提供了一个有价值的平台。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号