期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

一种汉语电子词典的新结构 总被引：4，自引：0，他引：4

刘东立滕永林《中文信息学报》1995,9(3):59-68

汉语电子词典是汉语机器翻译系统的最基本的组成部分, 其组织结构的好坏对整个系统的效率具有直接的影响。本文提出一种节省存储空间且查询高效的汉语词典存储结构：以领头字为关键字的一级索引结构。通过理论推导和实例说明, 证明了该结构的高效性和实用性。文中对词典的一般组织结构作了简单的介绍, 并通过实例将其与新的词典结构作了比较。相似文献

2.

一种简单,高效的电子词典组织策略 总被引：1，自引：0，他引：1

何鸿君王明昕《计算机科学》1996,23(2):56-57

电子词典的应用领域越来越广,不仅可以作为系统的一部分,也可以独立形成产品。事实上,当前相似文献

3.

基于公安计算机网络的汉维在线电子词典的设计

亚森·艾则孜《计算机与网络》2008,34(3):134-136

文章介绍了在线词典、维吾尔文信息处理以及在线查询等关键技术,并在此基础上提出了在公安计算机网络上实现在线汉维电子词典的设计方案。相似文献

4.

基于面向对象机制构造机器翻译系统词典类库

黄德根杨元生施勇《小型微型计算机系统》2001,22(7):845-847

本文提出用面向对象理论来建立机器翻译词典基类的方法,成功地用一种通用的模式来实现机器翻译中各科电子词典的管理。新方法较大地提高了机器翻译系统的可靠性、可维护性与可重用性,并已在NHWIN中日－日中机器翻译系统中得到了很好的应用。相似文献

5.

带标记音节的双向维汉神经机器翻译方法

下载免费PDF全文

艾山·吾买尔斯拉吉艾合麦提·如则麦麦提西热艾力·海热拉刘文其吐尔根·依布拉音汪烈军瓦依提·阿不力孜《计算机工程与应用》2021,57(4):161-168

近年来,基于神经网络的机器翻译成为机器翻译领域的主流方法,但是在低资源翻译领域中仍存在平行语料不足和数据稀疏的挑战.针对维-汉平行语料不足和维吾尔语形态复杂所导致的数据稀疏问题,从维吾尔语的音节特点出发,将单词切分成音节,同时融入BME(Begin,Middle,End)标记思想,提出一种基于带标记音节的神经网络机器翻... 相似文献

6.

联合式多引擎维汉机器翻译系统 总被引：1，自引：0，他引：1

下载免费PDF全文

宿建军张小燕吐尔洪·吾司曼李晓《计算机工程》2011,37(16):179-181

根据维吾尔语形态变化丰富的特殊性,搭建一个基于Factored的维汉机器翻译系统,将Factored系统和基于层次短语的Joshua翻译系统以及Moses中基于句法的翻译模型进行系统融合,构建混淆网络。提出一种词级和句子级联合融合的维汉机器翻译方法,利用一致性网络进行词级融合,并采用最小贝叶斯算法进行句子级融合。实验结果表明,联合式多引擎方法能提高1.72%个BLUE-SBP值。相似文献

7.

面向维汉机器翻译的语料筛选技术研究*

孔金英温政阳杨雅婷王磊李晓《计算机应用研究》2016,33(12)

统计机器翻译是近十年来的主流机器翻译技术,其在维汉机器翻译中良好的性能已经得到了广泛的认可。维汉统计机器翻译的最终翻译性能同样是受这几方面的影响：翻译模型、语言模型、语料质量和规模等。本文旨在通过对维汉双语训练语料的筛选来提高最终的机器翻译性能。在相关学者的研究基础上,本文提出了改进的IBM1模型评价句对齐质量、双语语言模型困惑度进行语料筛选和多种筛选指标综合求交集的方法。这些方法没有语言特性的依赖,支持维汉双语语料的筛选。通过实验可证明,使用这些方法筛选而来的语料训练出的维汉翻译模型的性能更优。相似文献

8.

维-汉统计机器翻译中维吾尔语预处理研究

艾孜孜·吐尔逊杨雅婷吐尔洪·吾司曼周俊林李晓《计算机工程与设计》2014,(11):4034-4039

为有效降低维-汉统计机器翻译中语料质量对翻译质量的影响,对维吾尔语文本预处理技术进行研究,结合维吾尔语文本语料的语言特征和多样性,提出基于语法规则和词法规则结合的维吾尔语文本预处理方法。在对维吾尔语文本中的语义单元、对偶词和标点符号进行特征分析的基础上,导出维吾尔语文本词例化和标点符号规范化的规则和处理流程。实验结果表明,该研究有效降低了词对齐阶段的单词数量、缓解了数据稀疏,提高了翻译质量。相似文献

9.

基于J2ME的维汉双语电子词典的研究与实现①

张永才吾守尔·斯拉木《计算机系统应用》2010,19(5):229-231

在WTK平台上使用J2ME技术开发实现了维汉双语电子词典。分析设计了合理的词典的词库文件结构和良好的用户界面,选用折半查找算法来实现快速搜索词语,并实现了手机数字键盘和触摸屏并用的维吾尔语输入方式。相似文献

10.

基于J2ME的维汉双语电子词典的研究与实现①

张永才吾守尔·斯拉木《计算机系统应用》2010,19(7):229-231

在WTK平台上使用J2ME技术开发实现了维汉双语电子词典。分析设计了合理的词典的词库文件结构和良好的用户界面,选用折半查找算法来实现快速搜索词语,并实现了手机数字键盘和触模屏并用的维吾尔语输入方式。相似文献

11.

会议场景下融合外部词典知识的领域个性化机器翻译方法

刘庆峰刘晨璇王亚楠张为泰刘俊华《中文信息学报》2019,33(10):31-37

会议场景下通过语音识别和机器翻译技术实现从演讲人语音到另外一种语言文字的翻译,对于跨语言信息交流具有重要意义,成为当前研究热点之一。该文针对由于会议行业属性带来的专业术语和行业用语的翻译问题,提出了一种融合外部词典知识的领域个性化方法。具体而言,首先采用联合占位符和拼接融合的编码策略,通过引入外部词典知识,在提升实体词、专业术语词翻译准确率的同时,兼顾翻译结果的流畅性。其次提出基于分类的领域旁支参数个性化自适应策略,在保持通用领域翻译效果的情况下实现会议相关领域翻译质量的提升。最后基于上述方案,设计了一套领域个性化自动训练系统。实验结果表明,在中英体育、商务和医学会议翻译任务上,该系统在不影响通用翻译的情况下,平均提升9.22个BLEU,获得较好翻译效果。相似文献

12.

汉法机器翻译系统初探 总被引：2，自引：0，他引：2

祁依虹董清富茅于杭《计算机工程与应用》2002,38(18):114-116

文章讨论了汉法机器翻译系统(CFMT)中的汉语分析和法语生成问题。以规范的汉语书面语的翻译为目标,研究可扩展的实用化的汉法机器翻译系统,系统中采用后部优先最大匹配算法及词义纠错的方法实施对源语文本的词切分,编程中将程序和规则相分离以提高系统的易维护和可扩充性。初步实现的系统曾对部分常用句型的例句进行了测试,表明该系统的设计是合理可行的。相似文献

13.

多策略汉日机器翻译系统中的核心技术研究 总被引：1，自引：0，他引：1

杜伟陈群秀《中文信息学报》2008,22(5):60-66

多策略的机器翻译是当今机器翻译系统的一个发展方向。该文论述了一个多策略的汉日机器翻译系统中各翻译核心子系统所使用的核心技术和算法,其中包含了使用词法分析、句法分析和语义角色标注的汉语分析子系统、利用双重索引技术的基于翻译记忆技术的机器翻译子系统、以句法树片段为模板的基于实例模式的机器翻译子系统以及综合了配价模式和断段分析的机器翻译子系统。翻译记忆子系统的测试结果表明其具有高效的特性;实例模式子系统在1 559个句子的封闭测试中达到99%的准确率,在1 500个句子的开放测试中达到85%的准确率;配价模式子系统在3 059个句子的测试中达到了89%的准确率。相似文献

14.

交互式机译系统IHSMTS的多策略翻译引擎

晋薇夏云庆王建德《计算机工程》2002,28(7):58-60

采用了多策略的翻译方式,融合了,和机助人译等思想,提高了自动构造译文的质量,并实现了良好的经验记IHSMTSRBMTEBMT忆和知识自动获取。同时,采用智能的人机交互技术,构建了一个机助翻译平台。文章介绍了的翻译处理原理和系统关键技术的实IHSMTS现方法。相似文献

15.

古文翻译系统的设计与实现 总被引：1，自引：0，他引：1

王爽熊德兰王晓霞《数字社区&智能家居》2009,5(2):855-856,867

古文翻译对研究古代历史文化、继承前人成果等有重要的意义。该文结合机器翻译研究方法和技术,设计实现了一个古文自动翻译系统,能够实现部分古文献的翻译和标注。相似文献

16.

基于Ontology的英汉机器翻译研究 总被引：8，自引：1，他引：7

王小捷钟义信《中文信息学报》2000,14(5):8-15

高质量的机器翻译(Machine Translation)系统必须充分结合语言学知识以及语言中性的世界知识。近年来,ontology被广泛用于在概念层对世界知识建模,本文介绍一个基于ontology的英汉机器翻译模型系统,在这个系统中,ontology作为世界知识的模型,它是通过把概念组织成一个层次结构并同时在概念间建立丰富的概念联系而构成的。通过把某种语言中的词汇映射到ontology中的概念,可以支持在源语言分析时进行歧义消解和目标语生成时的词汇选择,并可以作为源语言和目的语言之间的中介表示的概念来源。在系统中,中介表示是用概念图(Conceptual Graph)来表示的。相似文献

17.

傣泐文-汉文互译有声电子词典 总被引：1，自引：0，他引：1

胡刚王嘉梅李炳泽林睿希利补发《计算机系统应用》2016,25(7):8-16

软件是基于Visual C++ 6.0和Access 2003工具来完成的,在Unicode字符集模式下进行软件设计,解决当前民族文字软件开发时的系统使用兼容性以及字符的输出乱码等问题.本开发模式使用简单、操作稳定、接口灵活,在便于用户对词汇和语音数据库进行统一处理（备份、打印）的同时,也为其它民族文字翻译软件的开发提供了初期技术指导.目前面向傣族地区的翻译辅助工具还尚未推出,“傣泐文-汉文互译有声电子词典”是傣文信息化领域的一个重要“应用创新”成果,是开展少数民族语言文化信息元表示与提取研究的基础支撑,其作用主要是负责傣文的查询、翻译、朗读等工作.傣汉互译电子词典设计实现了傣汉对照互译、傣语真人朗读、傣语音标显示等常用功能,同时还支持对词库进行添加、修改、删除自定义操作,实现了良好的人机交互功能. 相似文献

18.

互联网机器翻译

王海峰吴华刘占一《中文信息学报》2011,25(6):72-81

该文在回顾机器翻译发展的基础上,总结了主要的机器翻译方法,并主要阐述互联网机器翻译的特点及面临的挑战.面向互联网机器翻译的应用需求,并针对互联网资源具有海量、高噪声、时效性、稀疏的特点,提出了多策略混合翻译方法、资源挖掘和过滤以及分布式处理技术、领域自适应技术,针对数据稀疏论述枢轴语言技术和新语种快速部署技术;然后结合... 相似文献

19.

一种适用于机器翻译的汉语分词方法

奚宁李博渊黄书剑陈家骏《中文信息学报》2012,26(3):54-59

汉语分词是搭建汉语到其他语言的统计机器翻译系统的一项重要工作。从单语语料中训练得到的传统分词模型并不一定完全适合机器翻译^[1]。该文提出了一种基于单语和双语知识的适应于统计机器翻译系统的分词方法。首先利用对齐可信度的概念从双语字对齐语料中抽取可信对齐集合,然后根据可信对齐集合对双语语料中的中文部分重新分词;接着将重新分词的结果和单语分词工具的分词结果相融合,得到新的分词结果,并将其作为训练语料,利用条件随机场模型训练出一个融合了单双语知识的分词工具。该文用该工具对机器翻译所需的训练集、开发集和测试集进行分词,并在基于短语的统计机器翻译系统上进行实验。实验结果表明,该文所提的方法提高了系统性能。相似文献