首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
2.
一种应用Unicode设计多语言实时切换应用程序的解决方案   总被引:1,自引:0,他引:1  
利用V ISUAL C++开发环境设计一个基于U N ICODE字符集的多语言应用程序。为方便使用,设计了实现多语言实时切换的应用程序。实现原理是将各种语言资源脚本用U N ICODE字符集保存,并封装到“卫星”资源动态链接库中,通过实时动态地加载不同语言动态库,实现了软件界面的多语言实时切换。  相似文献   

3.
综合型语言知识库的建设与利用   总被引:15,自引:4,他引:15  
语言知识库的规模和质量决定了自然语言处理系统的成败。经过18年的努力,北京大学计算语言学研究所已经积累了一系列颇具规模、质量上乘的语言数据资源:现代汉语语法信息词典,大规模基本标注语料库,现代汉语语义词典,中文概念词典,不同单位对齐的双语语料库,多个专业领域的术语库,现代汉语短语结构规则库,中国古代诗词语料库等等。本项研究将把这些语言数据资源集成为一个综合型的语言知识库。集成不同的语言数据资源时,必须克服它们之间的“缝隙”。规划中的综合型语言知识库除了有统一的友好的使用界面和方便的应用程序接口外,还将提供支持知识挖掘的工具软件,促使现有的语言数据资源从初级产品形式向深加工产品形式不断发展;提供多种形式的知识传播和信息服务机制,让综合型语言知识库为语言信息处理研究、语言学本体研究和语言教学提供全方位的、多层次的支持。  相似文献   

4.
资源稀缺蒙语语音识别研究   总被引:1,自引:1,他引:0  
张爱英  倪崇嘉 《计算机科学》2017,44(10):318-322
随着语音识别技术的发展,资源稀缺语言的语音识别系统的研究吸引了更广泛的关注。以蒙语为目标识别语言,研究了在资源稀缺的情况下(如仅有10小时的带标注的语音)如何利用其他多语言信息提高识别系统的性能。借助基于多语言深度神经网络的跨语言迁移学习和基于多语言深度Bottleneck神经网络的抽取特征可以获得更具有区分度的声学模型。通过搜索引擎以及网络爬虫的定向抓取获得大量的网页数据,有助于获得文本数据,以增强语言模型的性能。融合多个不同识别结果以进一步提高识别精度。与基线系统相比,多种系统融合的识别绝对错误率减少12%。  相似文献   

5.
《中文信息学报》2006,20(5):52-50,57
在国家高科技研究规划发展项目(863)和国家重点基础研究发展规划项目(973)以及其他项目的支持下,由中国中文信息学会语言资源建设和管理工作委员会发起,由中文语言(包括文本、语音、文字等)资源建设和管理领域的科技工作者自愿组成了中文语言资源联盟,该联盟是学术性、公益性、非盈利性的社会团体。本团体隶属于中国中文信息学会,接受中国中文信息学会语音资源建设和管理工作委员会的业务指导和监督管理。  相似文献   

6.
张爱英 《计算机科学》2018,45(9):308-313
利用多语言信息可以提高资源稀缺语言识别系统的性能。但是,在利用多语言信息提高资源稀缺目标语言识别系统的性能时,并不是所有语言的语音数据对资源稀缺目标语言语音识别系统的性能提高都有帮助。文中提出利用长短时记忆递归神经网络语言辨识方法 选择 多语言数据以提高资源稀缺目标语言识别系统的性能;选出更加有效的多语言数据用于训练多语言深度神经网络和深度Bottleneck神经网络。通过跨语言迁移学习获得的深度神经网络和通过深度Bottleneck神经网络获得的Bottleneck特征都对 提高 资源稀缺目标语言语音识别系统的性能有很大的帮助。与基线系统相比,在插值的Web语言模型解码条件下,所提系统的错误率分别有10.5%和11.4%的绝对减少。  相似文献   

7.
本文主要对情报检索语言与网络资源信息的关系进行讨论与分析,以情报检索语言对网络信息的作用为研究基点,从情报检索语言与网络信息的原始形态、与网络二次信息之间的关系以及与网络信息需求的关系等三个角度,对情报检索语言与网络信息资源组织的关系进行探讨,最后对网络情报语言与传统检索方式进行比较。  相似文献   

8.
积20余年之努力与锤炼,北京大学计算语言学研究所完成的一项科研成果“综合型语言知识库”于2007年2月通过了教育部组织的技术鉴定。鉴定结论认为“其规模、深度、质量和应用效果在我国语言工程实践中是前所未有的。该成果是以汉语为核心的多语言知识库建设中最全面、最重要的研究成果,总体上达到了国际领先水平”。本文在介绍以《现代汉语语法信息词典》为基础的综合型语言知识库的规模、构成、内容、品质和发展历程之后,陈述建设综合型语言知识库的理念,期望与读者分享在计算语言学和自然语言处理这一交叉学科领域内治学的心得与研发的经验。同时也对这项成果的应用实例进行分析,评估它的应用潜力,期望它在以汉语为核心的多语言信息处理事业的发展中起到铺路填坑或者投石问路的作用。  相似文献   

9.
旅游是城市对外交往和传播的重要窗口,其中的语言服务质量和水平对城市形象、城市建设有着直接影响。本文从建设背景、平台构建、后期规划等方面介绍北海旅游语言服务平台的设计与建设,该平台以旅游领域的语料为基础,旨在提供“语言服务+技术”的可行方案,助推北海市旅游领域语言服务的规范化、标准化、常态化建设。  相似文献   

10.
与西方语言相比,印地语是东南亚地区的一种低资源语言。由于缺少相应的语料、标注规范及计算模型,当前印地语自然语言处理工作并未得到重视,也不能较好地迁移通用语种研究中的前沿方法。该文在进行文献调研和计量分析的基础上,回顾了印地语自然语言处理研究在基础资源建设、词性标注、命名实体识别、句法分析、词义消歧、信息检索、机器翻译、情感分析以及自动摘要等方面的研究进展,最后提出了该领域研究可能面临的问题及挑战,并展望未来发展趋势。  相似文献   

11.
自然语言生成是研究如何用计算机来生成自然语言文本的研究领域 ,经典结构是宏观规划、微观规划和表层生成的流水线结构 .分析了多语种自然语言生成系统 ACNL G中的微观规划器 ,提出了“基于语言资源预映射的句子优化器”,它不仅对句子进行优化 ,而且负责将语种无关的文章内容映射到具体语种的表达方式中 .其核心思想就是将处理过程同具体语种的语言资源相分离 ,但同时又以语言资源为导向 ,既继承了现有方法的优点 ,同时也解决了多语种条件下各语种之间细微差别的处理问题 ,使句子优化能够针对目标语种的特点进行优化操作 ,从而使优化效果有实质的提高 ,进一步发展了多语种文本生成的理论  相似文献   

12.
曹晓刚 《程序员》2005,(7):38-39
Java 虚拟机的起源与构造当我们说到“Java”这个词的时候,指的是四个相互关联的概念:Java 语言、Java API、Java Class 文件格式、Java 虚拟机。整个 Java 体系是基于 Java 虚拟机构造的,正因为如此,才能实现 Java 的安全性和网络移动性。Java 并非是第一个采用“虚拟机”概念的体系,但却是第一个得到广泛运用的虚拟机平台。“虚拟”,是一种隔离物理资源与逻辑资源的手段。Java 虚拟机的“虚拟”,则是用来隔离物理机器,底层操作系统与 Java 语言规范实现的手段。虽然 Java 是一种面向对象的语言,我们平时大量使用的,是对象间的多态,  相似文献   

13.
语言变量模糊本体的表示与构建   总被引:2,自引:0,他引:2  
语言变量模糊本体是语言变量在语义Web中的明确的规范化说明,有利于模糊系统与语义Web的结合,使得语义web更加方便地处理模糊信息。通过引入语言变量模糊本体的概念,研究使用RDF表示模糊本体的方法,将本体与模糊概念表示为“资源”。进而以工业洗衣机的模糊控制为例,提出从模糊系统构造语言变量模糊本体的过程。  相似文献   

14.
刘炜 《办公自动化》2023,(10):33-35
产业数字化升级稳步推进,职业教育与产业发展同频共振更为迫切。职业教育课程数字化升级成为推动现代职业教育高质量发展的重要手段,构建兼具“数字化”、“专业化”与“实践性”的职业教育数字化课程资源迫在眉睫。以职业本科专业《装配式建筑施工》数字化课程资源建设为例,围绕建设思路、建设目标、建设内容等方面展开论述,提出职业本科化专业数字课程建设的逻辑起点,并明确“紧跟行业、校企协同、项目引领、标准先行、思政渗透、面向岗位、虚实相融”课程资源建设思路,为职业本科专业数字化课程资源建设明确方向。  相似文献   

15.
大规模平行语料库的缺乏是低资源神经机器翻译面临的关键问题之一。提出语言模型蒸馏的神经机器翻译方法,通过单语语言模型对神经机器翻译训练进行正则化,引入语言模型包含的先验知识以提升翻译效果。具体地,借鉴知识蒸馏思想,使用丰富单语数据训练的目标端语言模型(教师模型)构造低资源神经机器翻译模型(学生模型)的正则化因子,让翻译模型学习到语言模型中高度泛化的先验知识。与传统单语语言模型融合参与解码过程不同的是,本文方法中的语言模型只在训练阶段使用,不参与推断阶段,因此能够有效提升解码速度。在第十七届全国机器翻译大会CCMT2021维吾尔语-汉语和藏语-汉语2种民汉低资源翻译数据集上的实验结果表明,相比目前最先进的语言模型融合方法,BLEU提高了1.42%(藏汉方向)~2.11%(汉维方向)。  相似文献   

16.
本文从《义务教育信息科技课程标准(2022年版)》出发,以作者所在学校设计的跨学科主题“云南非遗”课程资源为例,从教学实践与研究出发,逐步剖析课程资源建设在课标、教材、教师教学指南和学生学习手册中的体现与变化,并结合互联网、物联网和人工智能跨学科活动设计,分析了课程资源建设的实践路径和数字资源开发的应用过程。  相似文献   

17.
低资源语音识别是当今语音界研究的热点问题之一,也是多语言小语种语音识别技术在实际应用中所面临的重要挑战之一。本文回顾并总结了低资源语音识别的 发展历史和研究现状,重点介绍了低资源语音识别在声学特征、声学模型和语言模型方面的若干关键技术研究进展。具体内容包括发音特征、多语言瓶颈特征、子空间高斯混合模型、卷积神经网络声学模型和递归神经网络语言模型,然后介绍了针对低资源语音识别的公开关键词搜索(Open keyword search,OpenKWS)评测,最后对低资源语音识别进行了总结和展望。  相似文献   

18.
语言是人类的公共财富,是不可再生的文化资源。语言生活是人类最重要的社会生活,语言认同、语言权利、语言保护、语言安全、语言传播、语言信息化等,越来越成为政治家关心、多学科参与、影响国家与国际新秩序建构的课题。  相似文献   

19.
该文简要回顾了中文信息处理30年的主要成果,以及近20年来中文信息处理中的计算语言学研究的状况。该文分析了汉语与英语的主要差异,讨论了语言的共性与个性。该文表示了对于中文大规模语料的词性标注、树库建设的质疑。该文提出未来的中文语言资源建设的一些设想,期望一些新的尝试,提出以语义取代现有的句法,以深度标注取代现有的浅层标注,具体将包括标注的目标的定点化,内容的多样化,步骤的阶段化,标注人员的大众化、群体化。文章还提出了未来发展的关键点 技术的融合,人本计算。  相似文献   

20.
飞雪散花 《电脑迷》2009,(24):67-67
最近Google Translate增加了单词和整句朗读功能。此外,更在页面左侧增加了“经过翻译的搜索结果”和“工具和资源”功能,利用前者,我们能轻松地通过输入母语,搜索到指定语言网页中的内容,并将该网页语言自动翻译为我们的母语。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号