首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 531 毫秒
1.
本文定义了计算机词典的功能代码和功能表达式,描述采用功能表达式的方法,分析了目前广泛 流行的16种计算机双语词典的功能,对其优缺点进行了综合讨论,并对其发展趋势作出了预测。  相似文献   

2.
计算机双语辞典的强大功能是借助于相应的辞典结构实现的,深入了解其结构对于计算机双语辞典的创新和发展显得十分重要。本文定义了计算机双语辞典的结构单元、结构代码和结构表达式,并采用结构表达式的方法分析了目前流行的10种计算机双语辞典的结构,对当前计算机双语词典结构的优缺点进行了综合讨论,并对其发展趋势作了预测。  相似文献   

3.
1引言 计算机词典是一个非常复杂的系统,牵涉到很多方面的知识和技术。本人查阅了目前在我国比较流行的多种计算机英汉双语词典(详见参考文献),对词典的功能进行了分析、比较和研究,试图从中找出其共同的规律、虽然所依据的材料都是计算机英汉双语词典,但从中可以看出目前一般计算机双语词典的功能情况和应用情况。希望本文能为计算机词典的研究人员和开发商提供一些参考意见并起到抛砖引玉的作用。对计算机词典。为简便起见,下文中我们提到的词典,如不特殊声明一般是指计算机双语词典。2计算机双语词典的功能现状 通过对当前流行…  相似文献   

4.
计算机双语辞典的强大功能是借助于相应的辞典结构实现的,深入了解其结构对于计算机双语辞典的创新 和发展显得十分重要。本文定义了计算机双语辞典的结构单元、结构代码和结构表达式,并采用结构表达式 的方法分析了目前流行的 10种计算机双语辞典的结构,对当前计算机双语词典结构的优缺点进行了综合讨 论,并对其发展趋势作了预测。  相似文献   

5.
基于双语词典的汉英词语对齐算法研究   总被引:1,自引:0,他引:1  
邓丹  刘群  俞鸿魁 《计算机工程》2005,31(16):45-47
研究利用多部人读双语词典扩充双语词典的规模来改善词语对齐质量。介绍了一个在Ker算法基础上用双语词典进行汉英词语对齐的算法。提出了对齐窗口的概念,通过在对齐过程中设置对齐窗口,可以找到多对多的词语对应。  相似文献   

6.
以跨语言信息检索需求为背景,介绍了目前语义词典及应用的概况,根据蒙古文互联网发展的现状,从应用需求出发,提出构建面向跨语言信息检索的蒙汉双语语义词典的重要性,并利用构建领域本体的方法给出蒙汉双语计算机术语语义词典的初步设计方法。  相似文献   

7.
一种基于生语料的领域词典生成方法   总被引:7,自引:0,他引:7  
为了实现准确分词,实用的汉语信息处理系统都需有其专用的领域词典.针对现有词典构造方法存在的不足,本文提出了一种领域词典的构造方法;利用通用词典对领域生语料进行分词处理,并提出了基于切分单元的最大匹配算法,从而得到候选词串集,然后利用规则对其进行优化,最终生成领域词典.词典的生成过程基本上是自动完成的,人工干预少,易于更新;目前.本方法生成的领域词典已经应用于我们自主开发的“基于Web的智能答疑系统”中,并取得了较好的效果.  相似文献   

8.
基于双语对齐口语语料的翻译词典的自动生成   总被引:2,自引:0,他引:2  
提出了一个基于英汉双语口语对齐语料库的翻译词典的自动生成算法,首先利用释义词典过渡双语文本,得到“过滤词典”,继而通过统计共现概率,计算出所有词对的相互关联值,并且生成“汉英(英汉)相互关联值表”,对于每个源语词汇选取相互关联值最大的若干项目标误作为候选词对,分别赋予信任值1,然后统计每个候选词对人信任值作为翻译词典的分级标准,得到4个不同级别的词典,其中“过滤词典+4级词典”在召回率为93.5%的情况下,正确率达到93.389%。  相似文献   

9.
双语词典是跨语言自然语言处理中一项非常重要的资源。目前提取双语词典的方法主要是基于平行语料库和基于可比语料库,但是这两种方法在提取新词或者某些技术术语时都存在双语资源匮乏的问题。相比之下,基于部分双语语料的方法由于利用的是新闻或者百科知识,故可以很好地解决这个问题,然而目前基于部分双语语料的方法主要集中在对文本内容的提取上,缺乏对文本内容以外部分的提取。针对此不足,该文以中英文两种语言为例,提出了一种基于百科语料的中英文双语词典的提取方法。该方法是在对文本内容提取的基础上结合在线百科的结构特点,分别用五种不同的方法对百科语料进行提取,综合查重后得到的双语信息数量为969 308条。与以往的基于部分双语语料的双语词典的提取方法相比,该方法在在线百科语料上的提取数量提高了170.75%。  相似文献   

10.
双语词典是跨语言信息检索以及机器翻译等自然语言处理应用中的一项重要资源。现有的基于可比语料库的双语词典提取算法不够成熟,抽取效果有待提高,而且大多数研究都集中在特定领域的专业术语抽取。针对此不足,提出了一种基于词向量与可比语料库的双语词典提取算法。首先给出了该算法的基本假设以及相关的研究方法,然后阐述了基于词向量利用词间关系矩阵从可比语料库中提取双语词典的具体步骤,最后将该抽取方法与经典的向量空间模型做对比,通过实验分析了上下文窗口大小、种子词典大小、词频等因素对两种模型抽取效果的影响。实验表明,与基于向量空间模型的方法相比,本算法的抽取效果有着明显的提升,尤其是对于高频词语其准确率提升最为显著。  相似文献   

11.
本文介绍一种用于计算机汉字处理中的动态词典库技术。此技术一改目前众多计算机汉字操作系统静态词典库观念,从动态的角度分析与实现汉字词组的生成、修改、增加、删除和检索,其目的是给出一种实用、有效的汉字词组动态处理技术。  相似文献   

12.
《全衡》词典的设计与建设   总被引:2,自引:0,他引:2  
《全衡》是第一个较全面考虑香港和国际的需求的网上汉字输入系统,其核心部件是词典。《全衡》使用的是一部拥有六万余词条的词典,每一词条讲述一个词语,信息包括该词语的简体字形式、繁体字形式、汉语拼音表达式、粤语拼音表达式、仓颉输入法代码、速成输入法代码等。由其中任何一项入手,借助于系统中的检索程序可以方便地查找其它各项信息。这不仅有力地支持了汉字输入,对于汉语学习也很有帮助。本文简要介绍《全衡》的词典建设。  相似文献   

13.
机器翻译系统专业词典的设置原则和方法   总被引:1,自引:0,他引:1  
本文认为机器翻译系统中专业词典和基础词典之间是即分又合的关系,并试图用词典信息的优先级别来体现这种关系,用词典中参数和规则的设置原则以及词典的查询方法来实现这种关系,以协调两部词典在系统中的作用,此外还讨论了专业词典的收词原则。  相似文献   

14.
世界之窗浏览器大家应该熟悉吧,《电脑爱好者》普及版有不少介绍,它的体形精巧和功能实用为人们所称道。你还知道这个软件的主人——凤凰工作室,除出品有这款免费软件外,还有很多其他的小软件吗?今天我们就给大家介绍一款凤凰工作室出品的双向词典——梅花双语词典。它是一款非常简单但又很实用的电脑词典。  相似文献   

15.
马立东 《软件》2011,(10):8-11,15
研究适合词典编纂工作特点的英语拼写错误更正方法。根据VBA语法,用VB代码编程,对MicrosoftWord的可编程对象进行操作,实现计算机辅助英语拼写错误更正的半自动化处理。重点实现英语拼写错误及更正建议的批量自动提取和标注功能。通过对用户词典的程序控制,降低查错误报率,解决英语拼写变体差异引起的误报等问题。  相似文献   

16.
机器翻译系统中概念词典的设计与实现   总被引:3,自引:0,他引:3  
本文介绍了一个机器翻译系统中所需的知识源之一--概念词典,其知识表示形式、组织结构、每个知识单元的构成,并给出了一个对词典进行图形浏览和编辑的用户界面。  相似文献   

17.
本文提出了对词切分过程中的重要数据结构--词典的结构调整的新思路,使调整以后的词典可以适应动态调整、动态生成等功能,可以很好地体现当前语言使用中层出不穷的新的表达方式。该系统对文本进行多次遍历的方法,采用统计方法和动态词合成技术对词典进行动态修正,使词切分的结果更接近人们对自然语言的真实的理解。该系统具有一定的自我学习能力。  相似文献   

18.
在当前的基于统计的翻译方法中,双语语料库的规模、词对齐的准确率对于翻译系统的性能有很大的影响。虽然大规模语料库可以改善词语对齐的准确度,提高系统的性能,但同时会以增加系统的负载为代价,因此目前对于统计机器翻译方法的研究在使用大规模语料库的基础上,同时寻求其他可以提高系统性能的方法。针对以上问题,提出一种把双语词典应用在统计机器翻译中的方法,不仅优化了词对齐的准确率,而且得出质量更高的翻译结果,在一定程度上缓解了数据稀疏问题。  相似文献   

19.
基于语料库的词典编纂技术已经成为现代词典编纂的主流方法。词典的主要功能是检索。该文介绍一种服务于双语词典编纂的检索平台。平台从词典编纂的需求出发,实现了带运算符的检索、搭配统计、译词选择等功能,减轻了词典编纂人员的工作量。  相似文献   

20.
面向中文自动分词的可扩展式电子词典研究   总被引:1,自引:0,他引:1  
在中文自动分词及词性标注系统中,电子词典是系统的重要组成部分,也是影响系统性能的重要因素之一。介绍了电子词典应该具备的查询功能及常用的组织结构,给出了一种结构为系统词典+用户词典的可扩展式电子词典机制。其系统词典是基于首字Hash散列的逐字二分词典结构,用户词典采用基于首字Hash散列的链接表词典结构,具有很强的扩展性和实用性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号