首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
已有的Deep Web信息抽取算法主要对结构规范的网页进行模版的提取,目前多数Deep Web网页在结构上是非规范的,网页中记录属性字段可能缺失或重复、原子属性字段可能被html标签分隔。为了正确抽取这些非规范网页,提出了一种新方法:引入了记录的伪属性及其语义匹配概念,通过实现记录间伪属性序列的语义匹配实现信息抽取;提出了伪属性序列的模型及其语义匹配算法和记录Wrapper模型及其生成算法。实验表明,在结构不规范deep web网页的抽取上,能达到91%的查全率和93%的查准率,相对其它算法有一定优势。  相似文献   

2.
针对目前入侵检测匹配算法速率过慢的问题,提出了一种快速多模式匹配算法.一般情况下,该算法能充分利用匹配过程中本次匹配不成功的信息和已经匹配成功的信息,尽可能多地跳过待查文本串中的字符,不需要匹配目标文本串的每个字符,就能一次性实现对文本的快速搜索.此外,该算法由于采用组合状态自动机,还能对中文进行快速搜索.实验结果表明,本文算法具有更高的检测效率,能有效降低系统的丢包率.  相似文献   

3.
基于小区域字符模板匹配的金属标牌字符串识别   总被引:1,自引:0,他引:1  
提出了一种基于小区域的快速模板匹配算法,实现了一行标牌字符串的识别,在利用投影法求得字符所在位置以后制作被匹配图像数组以及模板,然后进行识别。由于算法只对存在字符的区域进行小范围匹配,省去了在整幅图像上搜索无关数据信息的过程,与传统的模板匹配算法相比显著降低了算法的运行时间,能够满足图像匹配即时性的需要。  相似文献   

4.
镜头畸变是导致图像质量降低的主要因素之一.通常在图像存在畸变情况时,要先通过图像畸变校正方法来减小畸变对图像的影响,但校正过程较为复杂.本文提出了一种新的畸变图像的有效配准算法,算法分为初始匹配和松弛优化匹配两步,初始匹配算法采用圆投影匹配算法,松弛匹配算法则以向量旋转角的旋转和缩放不变性特征作为初始匹配对的优化准则,首先计算向量旋转角度差值,然后通过构造支持度函数和剔除策略选出最优匹配对.实验证明,该算法在图像非线性畸变误差较大的情况下也能够实现正确匹配.  相似文献   

5.
提出一种新的搭配(Collocation)翻译方法,该方法在最大熵模型框架下,充分利用各种从单语和双语语料库中获取的信息.与过去的过分依赖双语语料库的方法不同,新的搭配翻译方法可以使用单语语料库训练翻译模型,在搭配内在信息的基础上,进一步引入了上下文信息.采用EM(Expectation Maximization)算法估计基于上下文的词汇翻译概率.本模型同时具备集成来自双语语料库信息的能力.实验表明,本文方法优于现有的基于单语语料库的搭配翻译方法,在双语语料库的支持下还可以得到更好的结果.  相似文献   

6.
一种基于匹配强度的特征点匹配消除歧义算法   总被引:1,自引:1,他引:0  
双视图的特征点匹配过程中,用相关法进行初始匹配以后匹配集合中会出现很多有歧义的匹配点,其中含有大量的误匹配点,这样的匹配点对集合不利于对基本矩阵进行有效估计.提出一种消除匹配歧义的算法,求一个称为匹配支持强度的函数值,这个函数描述的是一个匹配点对被附近其他匹配点对支持的程度,然后用某种策略,将匹配支持强度最高的匹配点对提取出来放入一个集合,以达到消除匹配歧义的目的.实验结果证明该算法能较好的达到消除匹配歧义的目的,消除歧义以后得到的匹配点正确率很高.  相似文献   

7.
分布式信息资源发布订阅推荐模型研究   总被引:1,自引:1,他引:0  
针对现有网络信息资源分布式特征和语义搜索的要求,提出一种应用发布/订阅技术实现信息资源语义推荐模型。资源以消息方式发布到分布式模型系统中,用户的个性化要求通过订阅方式存储在查询本地,实现将用户被动搜索信息变为系统主动推荐个性化的信息服务的转变,同时应用语义Web技术实现基于内容的信息匹配。该系统模型改变了现有基于网页搜索信息资源的方式,更易于部署,实验结果表明,该模型比传统的网页推荐模型信息匹配准确率更高。  相似文献   

8.
在网络文字、图像视频、音频数量日益增长的网络世界中,网络爬虫爬取结果变得越来越差,主要表现在爬取网页的精确率低、召回率低和重复率高等方面。为解决这些问题,结合市场匹配基本原理和网络爬虫的特点,提出一种基于市场匹配算法的多Agent智能爬虫系统。基于市场匹配算法,设计了多Agent智能爬虫系统,以雅虎一级目录12个主题为测试数据对网络爬虫爬取网页的精确率、召回率和重复率进行了分析。结果表明,与未使用市场匹配算法的系统相比较,基于市场匹配算法的多Agent智能爬虫系统的精确率提高了9%、召回率提高了8%、重复率降低了5%,其爬虫性能有较大改善。  相似文献   

9.
研究了全景图生成过程中相关图片拼接的问题.探讨了通常的2种图像拼接算法及其优缺点,在定义匹配图、包含图和模板图的基础上,提出了一个基于模板匹配的全景图拼接算法,引入标准相似度实现模板匹配,在Visual C 6.0环境中编程实现图片的拼接,并验证了算法的正确性.  相似文献   

10.
在扩展一种基于内容的负载共享算法的过程中,总结了将初始化负载分布到集群成员服务器的模型和方法,探讨了依据慈善算法进行偶图一对多匹配即k-完全匹配的问题.给出了一些应用慈善算法进行偶图匹配的重要实验结果,并对慈善算法存在的问题和在超图等研究领域的潜在应用进行了讨论.  相似文献   

11.
探讨汉英句级对齐软件设计中两项主要技术,即哈希算法与词典语义映射在对齐中的运用。哈希算法能帮助软件从词典大量的英汉词条语义信息中快速提取所需的对应义,结合语义映射,将需要对齐的句子关键词信息进行语义识别,从而有效提高汉英句子对齐效果。  相似文献   

12.
篇章中的句子,与孤立的句子不同,受制于语篇整体性和连贯性,其语意焦点变得明确。因而在翻译语篇中的句子时,译文的语序、句型、结构的选择都会受到限制。为了在翻译教学中帮助学生具备语篇整体意识,实现译文的连贯流畅,在主位结构等理论的指导下,通过对比英汉语篇连贯性特点,分析了学生译文和参考译文的差距。指出在汉译英时,要从汉英差异对比入手,了解英汉双语主位结构的非对应性,在篇章连贯性要求的制约下,来选择恰当的英语语序、语态、结构和句型。  相似文献   

13.
面向汉英机器翻译的双语语料库的建设及其管理   总被引:7,自引:0,他引:7  
近年来,在语言信息处理的研究和开发中,单语和多语语料库(主要是双语语料库)的作用日益突显出来。为了支持一项正在进行的汉英机器翻译系统的开发,我们建立了一个汉英双语语料库。本文简要介绍了该语料库的建设和管理情况。  相似文献   

14.
针对材料英语的一些基本特征以及英汉翻译过程中出现的问题和原因进行了分析探讨,指出材料工作者要了解材料英语的文体和语言特点,翻译时要采取已经普遍接受的译法,不能完全直译,更不能任意创造。同时介绍了翻译过程中常用的一些基本技巧,并通过例句对其进行了详尽阐述。  相似文献   

15.
试析英语长句的翻译技巧与方法   总被引:2,自引:0,他引:2  
在英译汉中英语句子长而且比较复杂,而汉语则相反。由于两种语言表达习惯上的差异,长句的翻译往往成为翻译难题。本文结合例子,介绍并分析了几种翻译长句的方法:顺译法、逆译法、分译法和综合法。  相似文献   

16.
唐诗在句法方面省略现象非常多见。唐诗中的省略大致有如下几种形式省略平行语,使用名词仂语,使用关系语,使用紧缩句等。由于汉语语词组合灵活自由,行文重意合,偏流散,而英文句子结构严谨,因此,在很多情况下,对于汉语中省略的词句,在英译文中必须采取一定弥补措施,才不至于造成漏译误译。  相似文献   

17.
由于英汉两种语言的差异,有些英语结构和一些特定的表达方式在译成汉语时不能按原文一一对应地直译,而要进行“逆向”处理,也就是把英语中有些结构或表达方式转换成与原文字面意义相反或结构相反的汉语,才能达到与原文等值或近似等值的效果。本文就意义和结构两方面的逆向翻译作了一些探讨和分析。  相似文献   

18.
针对译界对法律文本英译汉的研究较多,但对汉译英这个领域的研究却相对薄弱的现状,探讨法律文本无主句的英译方法,并归纳出四种译法,即译成被动语态、补足主语、将非主语成分转化为主语成分和译成用it做形式主语.  相似文献   

19.
在英译汉中英语句子通常长且结构复杂,而汉语则相反.由于两种语言表达习惯上的差异,往往成为翻译难题.介绍了5种长句翻译法,即顺译法、倒译法、分译法、插入法、综合译法。  相似文献   

20.
英语阅读理解长期以来是英语教学的弱项。要解决这个问题,需要做多方面的探讨。但万丈高楼平地起,章是由句子构成的。本从英汉句子结构的本质着手,分析了它们的结构差异,并指出了它们对英汉互译的启示。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号