首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 562 毫秒
1.
机器翻译错误分析旨在找出机器译文中存在的错误,包括错误类型、错误分布等,它在机器翻译研究和应用中发挥着重要作用。该文将人工译后编辑与错误分析结合起来,对译后编辑操作进行错误标注,采用自动标注和人工标注相结合的方法,构建了一个细粒度英汉机器翻译错误分析语料库,其中每一个标注样本包括源语言句子、机器译文、人工参考译文、译后编辑译文、词错误率和错误类型标注;标注的错误类型包括增词、漏词、错词、词序错误、未译和命名实体翻译错误等。标注的一致性检验表明了标注的有效性;对标注语料的统计分析结果能有效地指导机器翻译系统的开发和人工译员的后编辑。  相似文献   

2.
用DEIT之类编辑器处理文本文件时,可能会遇到内存不够,编辑工作无法进行的问题。对此,如果选用WPS类型编辑器进行编辑,问题可以解决。以上说明:文本文件的编辑不仅与文件长度有关,而且还与所用的编辑器有关。目前,各种各样的编辑器非常多。按对内存的使用方式,编辑器可分为覆盖和非覆盖式两类。通常,前一类带有覆盖文件(加扩展名为OVL),它使用了程序设计的覆盖技术,即在内存不够的条件下,先将被处理文件的一部分装入内存,需要时再加载文件的后续数据,这样又件被分成若干个部分,交替覆盖加载被处理,从而解决文件过长与…  相似文献   

3.
译后编辑是近年来随机器翻译发展新兴的计算机应用研究领域。综述了译后编辑所涉及的三方面的技术问题:自动译后编辑,自动机器翻译质量评估以及译后编辑工作量测量。自动译后编辑与自动机器翻译质量评估均应用自然语言处理领域相关技术,通过自动完成部分编辑工作、筛选机器翻译译文来降低译员工作量,从而提高效率。对译后编辑工作量的研究侧重于分析机器翻译译文的错误对译员工作量的影响,为译后编辑系统环境的设计提供理论依据。总体而言,译后编辑技术研究的主要目的是提高译员的工作效率。  相似文献   

4.
根据已有绘图工具在绘制自由曲线方面的不足,提出了基于COM服务器的NURBS曲线编辑器的思想并编程实现。该编辑器既可以实现单独NURBS曲线编辑,也可以被Office软件调用实现在文档编辑。该编辑器为用户编辑符合自己需要的自由曲线提供了一种选择。  相似文献   

5.
战毅 《程序员》2013,(5):116-119
网站需要用户录入信息时,都离不开富文本Web编辑器。富文本Web编辑器中包含哪些关键技术呢?本文将结合UEditor进行阐述。编辑命令?当我们在Word中选中一段文字,点一下加粗按钮,文字就会呈现粗体效果。我们可以认为编辑器执行了一条“加粗”编辑命令。  相似文献   

6.
VRML编辑器中可视化编辑路由语句的设计与实现   总被引:6,自引:0,他引:6  
VRML语言使用事件路由机制处理事件,其功能是为用户提供一个动态、交互的三维世界.由于涉及到多个三维对象之间的交互控制问题,路由(ROUTE)编辑被认为是一项复杂的认知行为.传统的VRML编辑器因其线性本质,一般不提供直观、可视的路由编辑.基于此,在研究交互事件机制的基础上,设计并实现VRML语言中路由控制的可视化编辑。  相似文献   

7.
数学教师在用WORD编辑试卷、教案或用PowerPoint制作演示文稿的过程中,一定会遇到公式编辑的要求。有时还要使用特别的符号、为公式更换其它的颜色等等。工欲善其事.必先利其器。要想轻轻松松完成公式编辑的任务.仅仅靠Word自带的公式编辑器就有点力不从心了。还是让mathtypo 5.2来帮忙吧。它是一个强大的数学公式编辑器,可以在Word中方便地调用.是我们编辑数学资料的得力工具,您可以到http://www.mathtype.com/en/dl/MathType52Setup.exe下载使用。相信大家对基本的公式编辑功能都比较熟悉.咱就不多说了。我们还是一起来看看如何解决这些公式编辑过程中的一些特别任务吧。  相似文献   

8.
中文Word6.0是基于Windows环境下的高级编辑排版软件系统。它不但可以处理文字,还可以处理丰富多彩的图形,排出复杂的公式和图表;它界面友好,操作直观方便,真正做到了所见即所得。利用Word提供的功能方便快速地编辑打印文章,其中有许多妙处。1数学公式的安装与使用许多科技文章都需要插入各种各样的数学公式,一般的计算机文字处理软件是不具备编辑复杂数学表达式功能的,Wont提供了专门编辑数学公式的Equation编辑器。在安装Wold时需要选择手动安装(选用典型安装或最小安装都不安装Equation编辑器),并在选项菜单中选择图形,…  相似文献   

9.
GED是一个菜单驱动下的交互式图形编辑器,具有图形生成、图形编辑、图形文件管理和多属性文字标注等功能,是在TOrboC开发环境下实现的.本文着重介绍GED的功能设计和实现技术.  相似文献   

10.
为了有效翻译体育领域文本,特别是文本中的长句,本文提出了一种面向体育领域的句子主干翻译方法。该方法采用模板来表示句子主干,主要包括句法主干分析、模板转换和句子主干译文生成三个步骤。本文研究中特别针对体育领域的语言特点进行了模板的设计和获取;在译文生成过程中,则分别利用规则和模板,采用了短语级全译和句子级摘译相结合的混合生成策略,并引入翻译函数来处理形态变化。实验结果表明句子主干翻译方法能够获取句子的关键信息,在可懂度上优于完全翻译,其忠实度也令人满意,是处理体育领域文本的有效方法。  相似文献   

11.
文本水印通过在文本中嵌入版权标识信息(水印)来保护文本作品的知识产权。提出一种对文本中语句的主谓语进行编码来嵌入水印的方法。将水印信息转换成十六进制的Unicode码串,借助哈尔滨工业大学的语言技术平台(LTP),对文本中的语句进行一系列处理获取其中的主谓语,用上述Unicode码串中的一段对每一个主谓语进行编码表示,以此实现水印的嵌入。提取水印时,从被检测的文本中获取语句的主谓语,对照嵌入水印时形成的码本,对每个主谓语进行比较和译码,取出各主谓语所对应的Unicode码段,将它们按正确顺序拼接起来,转换成对应的字符,得到嵌入的水印信息。所提算法具有很好的隐蔽性,能有效抵抗各种常见的攻击。  相似文献   

12.
该文提出了字移编码和CRC校验技术的文本内容认证的脆弱型文本数字水印方案。通过使文本行内字符发生平移,即利用字间距的变化嵌入需要的水印信息。采用这种编码,首先是利用循环冗余检测技术(CRC)来求得该字符串的特征,然后是利用相邻字符之间的距离可以各不相同来得以实现。在水印检测时,通过重新计算CRC的余式,可以检测到文本是否遭受篡改。通过进一步的研究还可以发现,该方案不但可以以很高的精度检测到文本发生的篡改并能进行高精确度的定位,而且该方案还能将篡改进行分类:增加、删除和修改。  相似文献   

13.
网络信息审计系统中的多模式相似匹配算法   总被引:5,自引:0,他引:5       下载免费PDF全文
针对网络信息审计系统的需要,提出一种新颖的基于Episode距离的快速多模式相似串匹配算法.该算法把模式串集合转换为多个有限自动机,然后利用模式串集合建立一个状态驱动器.依次用待匹配串的字符驱动状态驱动器,由状态驱动器驱动各个有限自动机,实现了中英文混合的允许插入错误的相似多模式匹配.该算法不需要匹配每个字符,能充分利用匹配过程中本次匹配不成功的信息并结合改进的文本窗机制,跳过尽可能多的字符;能够控制每个模式串的允许错误上限;匹配速度与允许插入的错误字符教k无关.该算法在信息审计、数据库、信息检索等领域有  相似文献   

14.
In the dynamic dictionary matching problem, a dictionary D contains a set of patterns that can change over time by insertion and deletion of individual patterns. The user also presents text strings and asks for all occurrences of any patterns in the text. The two main contributions of this paper are: (1) a faster algorithm for dynamic string dictionary matching with bounded alphabets, and (2) a dynamic dictionary matching algorithm for two-dimensional texts and patterns. The first contribution is based on an algorithm that solves the general problem of maintaining a sequence of well-balanced parentheses under the operations insert, delete, and find nearest enclosing parenthesis pair. The main new idea behind the second contribution is a novel method to efficiently manipulate failure links for two-dimensional patterns.  相似文献   

15.
魏浩  解争龙  弋改珍 《微机发展》2013,(12):109-112
在介绍串空间理论基本概念、攻击者模型以及Kerberos协议的基础上,利用串空间理论得出Kerberos各协议参与主体和攻击者的迹,构造了协议的串空间,给出了Kerberos协议的丛图。在证明一个定理的基础上,使用启发式和反证法的思路,证明了认证服务器分配给客户端和应用服务器会话密钥的保密性,即攻击者从现有知识和构造能力无法推导出服务器分配给客户端和应用服务器的会话密钥;证明了客户端和认证服务器以及客户端和应用服务器能够相互认证,得出了Kerberos协议正确性的结论。  相似文献   

16.
从数据挖掘的角度对中文地址解构规则的获取与应用进行研究。该文提出了一种高效自动获取地址解构规则的方法:首先利用文本挖掘技术从训练数据集中挖掘出候选规则,然后生成最终的强规则,同时构建地址元素特征词典。最后,根据获取的知识进行地址解析,提取文本地址组成元素。试验结果证实了该方法的可行性。  相似文献   

17.
This paper describes a robust context integration model for on-line handwritten Japanese text recognition. Based on string class probability approximation, the proposed method evaluates the likelihood of candidate segmentation–recognition paths by combining the scores of character recognition, unary and binary geometric features, as well as linguistic context. The path evaluation criterion can flexibly combine the scores of various contexts and is insensitive to the variability in path length, and so, the optimal segmentation path with its string class can be effectively found by Viterbi search. Moreover, the model parameters are estimated by the genetic algorithm so as to optimize the holistic string recognition performance. In experiments on horizontal text lines extracted from the TUAT Kondate database, the proposed method achieves the segmentation rate of 0.9934 that corresponds to a f-measure and the character recognition rate of 92.80%.  相似文献   

18.
基于阻塞先验知识的文本层次分类模型   总被引:7,自引:0,他引:7  
文本层次分类中阻塞现象是影响层次分类器性能的重要原因。针对这一问题,提出基于阻塞先验知识的文本层次分类模型。该模型包括两部分:首先对阻塞分布进行估计,提出“阻塞对”识别技术,重点在于获取严重的阻塞方向;其次,把分析出的阻塞先验知识融合到分类过程中,利用层次拓扑结构修正算法,引导阻塞文本“回归”正确分类路径。在中文语料TanCorp上的实验表明,该算法在没有额外增加分类器数目的前提下,能有效改善层次分类性能,是解决层次分类阻塞问题的一种方法。另外,与平面分类算法比较后,该算法更稳定。  相似文献   

19.
现有的概率字符串匹配算法通过计算字符串之间的最小失配字符数(编辑距离),可求出字符串之间的相似度.这些算法平等地看待模式串和文本串,虽然可求出二者之间完整的编辑距离,但并不能解决以下问题:即判断是否模式串中至少有1/p的字符顺序地出现在文本串中.基于动态规划字符串匹配算法,提出了一个改进算法.该算法通过将字符串分段,在段内执行改进的概率匹配算法可求出段内的编辑距离,再结合回溯策略可以很好地解决上述问题.该算法的复杂性要低于基本动态规划匹配算法,且在某些情况下效率更高.就问题的一般性而言,该算法可广泛地应用于计算生物学、信息安全和信号处理等诸多领域.  相似文献   

20.
The recent rise in interest in text (or word) processing has meant the need for an increased awareness of string processing facilities offered by high level programming languages. In particular there is a need to re-examine how string processing is taught to novice programmers. This paper argues the case for a more natural set of string processing operations to be made available as part of general purpose high level programming languages used for teaching. The paper presents one set of primitive string operations which have been successfully presented to students in the context of text processing. Importantly, only a very few primitive operations are needed even for quite advanced string processing.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号