首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
越来越多的实践证明,词汇知识将是未来自然语言处理系统中不可或缺的组成部分。利用机器可读词典作为资源,首先通过对释义项进行分类,然后基于释义分析自动生成用于抽取词汇知识的模板,然后采用模板匹配的方法,实现词汇知识的自动抽取。通过一种基于最大熵模型的有监督的机器学习方法,对结果进行过滤。在应用到《应用汉语词典》中后,取得了良好的抽取效果。  相似文献   

2.
基于小规模语料库和机器可读词典的二元分布语义获取   总被引:1,自引:1,他引:1  
本文提出了一种基于小规模语料库和机器可读词典(Machine Readable Dictionary ,MRD)的无指导的动词语义获取方法。该方法不需要使用有义项标注的语料库,而是使用从语料中获得的V+N搭配以及MRD中多义词定义的应用实例中获得的知识。使用两种方法解决数据稀疏问题:首先,将词的相似性度量由直接共现扩展到共现词的共现,以共现聚类而不是共现词来计算词的相似度。其次,从MRD定义中获取名词的IS- A关系。通过这些方法,即使两个词不共享任何词,也可认为是相似的。实验表明,该方法可从很小规模的语料中获取知识,并在不限制词义的情况下达到85.7%的正确排歧率。  相似文献   

3.
仿射质点几何的可读机器证明   总被引:1,自引:1,他引:0  
邹宇  郑焕  张景中 《计算机应用》2010,30(7):1899-1901
讨论并发展了能自动证明几何定理的质点几何方法,建立了能处理希尔伯特交点类命题的仿射几何机器证明算法,并实现为Maple程序。对上百个非平凡命题运行的结果显示,这种方法不仅效率高,多数证明的可读性也令人满意。  相似文献   

4.
新一代通关检测系统使用了生物特征认证技术。而合有生物特征信息的机器可读旅行文档(Mrtds)的安全是一个极为重要的问题。本文中我们首先分析了对Mrtds中机器可读区数据的潜在威胁。然后总结了由国际民航组织(ICAO)推荐的系统安全方案,也就是基于公钥体系的数字签名。基于这些内容,我们把Mrtds的认证过程看作是被保护数据,相应的hash值和数字签名以及持有者共四个环节之间的连接。对于用于每个连接中的技术,也就是公钥体系,数字签名和生物认证技术,我们提出了一些附加的要求和安全特征。结果,改进的系统加固了每个连接,从而获得了更高的系统安全性。  相似文献   

5.
分词词典是汉语自动分词系统中的一个基本组成部分,其查询速度直接影响到分词系统的处理速度。文章提出并实现了一种用哈希算法和二分查找算法相结合的中文单词查找算法,实验显示,该算法可以实现对字符串的快速查找。  相似文献   

6.
本文介绍了在我们的英语翻译系统中机器词典的设计思想,重点在词典系统的分层构造和词典数据库与规则库相结合,体现了设计得把可维护性作为设计机器词典的重要目标之一。  相似文献   

7.
已有的机器证明方法在处理一些涉及大规模符号运算的几何问题时,常因算法复杂度过高或机器能力的限制,有时并不能在合理时间内实现可读机器证明. 故提出了复数法这一新的几何定理机器证明算法,并选用符号计算功能较为强大的软件Mathematica创建了新证明器CNMP(complex number method prover).新提出的复数法能有效地解决构造型几何命题,对用于测试与评价几何定理证明器性能的综合性平台TGTP(thousands of geometric problems for geometric theorem provers)上的180个几何问题的实验结果表明,CNMP的解题能力与运行效率均令人满意.尤其是对于一些具有相当难度的几何定理,如五圆定理、Morley定理、Lemoine圆定理、Thebault定理、Brocard圆定理等,CNMP均能在短时间内给出可读机器证明.  相似文献   

8.
基于语法和语义的德汉机器词典设计   总被引:1,自引:0,他引:1  
详细介绍德汉机器翻译系统(GCMTS)中基于语法和语义的机器词典的设计和信息表示。  相似文献   

9.
几何定理可读证明的自动生成   总被引:23,自引:2,他引:21  
用计算机能生成几何定理的易为人们理解的证明吗?这个几十年来进展很小的难题,自1992年以来有了突破性进展,对于一大类欧几何命题-构造几何例题,已有了相当有效的算法,基于此算法所编制的程序,已证明了500多非平凡的几何例题,对其中大多数例题,机器自动生的证明是简明而易于理解的,本文是对这一领域近三年来取得的进展的综述,包括了在非欧几何可读证明方面的最新成果。  相似文献   

10.
11.
Internet的飞速发展要求核心路由器每秒能转发几百万个以上的分组,实现高速分组转发的关键是路由表的组织和快速的路由查找算法。索引分离trie树结构建立了具有k比特的一级索引,m比特的二级索引和步宽为s、最大深度为m/s的多分支trie树结构。在这种数据结构中进行最长前缀匹配查找的算法复杂度为:O(m/s+2)。它具有算法简单、查找速度快、易于更新、便于向IPv6过渡等特点,是一种综合性能较好的快速最长前缀匹配查找算法。  相似文献   

12.
机器词典的信息表示及在汉英机器翻译中的实现   总被引:3,自引:1,他引:2  
在这篇文章中, 我们强调了机器词典对于机器翻译等自然语言处理系统的重要意义高质量的机器词典需要花费巨大的劳动词典知识来源于语言学研究和计算语言学的工程实践, 其编撰标准、信息表示及编码等均应考虑工程实现的效果本文结合作者正在研制的汉英机器翻译系统, 介绍了机译词典的有关实现问题, 并讨论了词典知识在汉语分析和汉英转换中的作用  相似文献   

13.
刘亚林  刘东  张晓 《计算机学报》2001,24(12):1272-1278
该文对路由器中的快速路由查找算法进行了研究。针对路由查找算法在查找速度、算法空间复杂度以及插入和删除表项的难度算方法存在的问题,提出了一种快速路由查找算法。该算法通过构造两级索引表结构来减小路由查找的访存次数以提高查找速度;利用前缀扩展的特性并采用特殊的数据结构来构建索引表,能支持动态插入、删除和更新路由;采用压缩技术对二级索引表进行压缩,从而大大减小了路由所需的存储空间。该算法最多四次访存,最少两次访存就完成一次路由查找。由于采用了压缩方法,所需存储空间很小,该算法不仅适合于软件实现,也适合于硬件实现。查找速度快、存储空间小并支持动态插入和删除是该算法的主要特点。  相似文献   

14.
介绍了在信息时代的背景下,海量数据快速查找算法的应用场景以及几种高效的查找算法,包括哈希、倒排索引、位图法,并且随后给出了多级缓存和分级索引的优化方法。  相似文献   

15.
本文介绍在单词记忆不准确的情况下, 如何查找词典以及如何只键入单词中的几个字母快速录入单词的算法。在辅助翻译和写作系统中, 词汇级的帮助是最基本的, 主要指词典查询。但很多情况下, 用户单词记忆不很准确, 只记住了几个字母, 本文解决这种情况下的模糊查询问题。这种模糊技术的核心是全文检索, 依赖于词典的特殊索引。在解决了模糊查询之后, 利用全文检索技术以及模糊二分查找技术进一步开发了写作系统中的快速录入功能。  相似文献   

16.
Trie数据结构是实现高速路由查找和分组转发的关键。由于商业原因,各厂商的实现方案都是保密的。为此,本文设计实现了便于高速动态路由查找的trie数据结构,并进一步实现了在trie数据结构上的基于前缀值的动态最长前缀匹配算法,提高了路由查找速度和分组发效率。  相似文献   

17.
本文按照参考文献I给出的词汇T-Y码,T-Z码和机读词典Hash索引文件的定义以及在Hash索引文件中冲突次数的计算公式和处理冲突的策略,为一个实用的机读词典建立了各级索引文件,试验结果具有参考价值。  相似文献   

18.
几何定理机器证明已经成功发展了多种新方法,但其中对中学几何中向量的机器证明研究没有抓住其回路的基本特征.文中以向量的回路为出发点,提出了基于回路的向量可读证明新方法,开发了机器证明新程序.该程序对常见的构造类型欧氏几何题目能快速作图,并依据题目类型的不同,分别用不同的向量方法对其进行自动推理,证明结果简短可读.经过大量实例测试,证明将向量用于几何自动推理是可行和高效的.与《超级画板》等中的证明器相比,文中算法在自动推理能力和证明过程可读性方面有较大提高.文中给出的基于向量的几何可读证明算法丰富了几何定理自动推理方法,并且具有应用于几何教学实践的价值.  相似文献   

19.
当前对有序数列查找常用二分查找,但是二分查找具有一定的约束性和特殊情况下的低效性,为此研究并设计了索引折半查找算法,理论上其平均查找效率优于二分查找的平均查找效率。对比实验验证了索引折半查找算法的良好性能。  相似文献   

20.
一种基于多重索引的大规模数据快速查找算法   总被引:1,自引:0,他引:1  
应俊  杨茂斌 《计算机科学》2009,36(3):258-260
在手持式设备移动计算中,为了实时获取信息,往往需要对数据进行高效查找,而这又与手持式设备较弱的计算处理功能相矛盾.从硬件体系与软件算法综合考虑角度出发,提出了一种基于大规模记录的索引快速查找算法.实践表明,该算法结合所设计的多层次硬件体系,能高效地实现数据快速定位查找.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号