首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
本文对实用中文理解中机器内部词典的构造提出一些可行方法。重点研究内部词典的组织内容,以及中文理解过程中句子切分、结构分析与词典的关联。同时,也指出实现中与西文系统词典的差异。通过比较借签,发现中文实现较之西文实现的优势劣势,以期在今后的研究中把握住方向,早日取得突破。  相似文献   

2.
基于语法和语义的德汉机器词典设计   总被引:1,自引:0,他引:1  
详细介绍德汉机器翻译系统(GCMTS)中基于语法和语义的机器词典的设计和信息表示。  相似文献   

3.
用于多语种机译系统的中文词典设计   总被引:1,自引:0,他引:1  
本文是中日合作机器翻译项目日方基本词典工作组朱美英女士1989年3月在日本情报处理学会自然语言研完会上发表的论文自然语言处理研究会资料,(71 一6(1989)) 。论文阐述了日本国际情报化协力中心(CICC)和中国软件技术公司(CSTC)共同开发的中文词典的设计方针及其词典结构。受作者委托由中日合作项目中方基本词典工作组袁琦先生将日文原稿翻译成中文, 并请朱美英女士对译文做审阅和校对。在此对内田先生和未美英女士表示感谢, 由于他们的支持和帮助, 这篇论文得以尽快地与国内读者见面。  相似文献   

4.
《现代汉语语义词典》管理系统的设计与实现   总被引:2,自引:0,他引:2  
主要介绍了用VB5.0为《现代汉语语义词典》设计并实现动态管理,多种查询管理系统的研究工作。  相似文献   

5.
程序设计语言的语义理解及语境分析   总被引:1,自引:0,他引:1  
本文讨论了通常程序设计语言的语义理解问题且提出了若干定义和概念,进而又论述了在不同层次上的等价性,从而为程序的转换和替代建立理论依据。本文还分析了程序设计语言及其源程序中的语境问题并提出了若干概念和定义,为软件移植性等的最化刻划提供帮助。  相似文献   

6.
本文介绍了一个在IBM PC机上设计和实现的带有语义理解的芟译汉保姆机器人规划系统。当用户输入一句英语祈使句,命令机器人干某项家务活如搬运东西或开电视机时,机器人理解其意后,就产生动作序列,进行动画仿真执行并显著中文译文。  相似文献   

7.
高阳  杨璐  刘晓升  严建峰 《计算机科学》2015,42(8):279-282, 304
潜在狄利克雷分配(LDA)被广泛应用于文本的聚类。有效理解信息检索的查询和文本,被证明能提高信息检索的性能。其中吉布斯采样和置信传播是求解LDA模型的两种热门的近似推理算法。比较了两种近似推理算法在不同主题规模下对信息检索性能的影响,并比较了LDA对文本解释的两种不同方式,即用文档的主题分布来替换原查询和文本,以及用文档的单词重构来替换原查询和文本。实验结果表明,文档的主题解释以及吉布斯采样算法能够有效提高信息检索的性能。  相似文献   

8.
蒙古语语义信息词典(SIKM)作为一部知识库已成为整个蒙古语语言资源的组成部分。自2009年至今,词典的研发取得了阶段性进展。SIKM现已收录5.7万多条记录,涵盖4个词典库。其中包含全部词语的1个“总库”,名词、形容词、动词等3个词类各建一个数据库。每个数据库文件都详细刻画了各词类词语及其语义属性的二维关系。目前已完成5.7万多条词语的语义分类和属性描述,该分类体系和词典的一些属性信息初步被应用到蒙古文信息处理相关基础研究和开发之中。介绍词典规模及结构,语义分类体系、属性字段描述以及研制过程中遇到的一些难点,词典的初步应用情况等内容。  相似文献   

9.
研究语义是当前人工智能、语义网、语义词典等研究领域的热点,它可以有效支持机器翻译和自然语言处理等技术.文章根据藏文独特的文法特性,运用藏文逻辑格和计算语言学知识,在保留藏文原有特点的基础上,为藏文语义关系抽取方法建立较完整的语义场,以此为藏文语义词典建设提供了基础性构建方法.  相似文献   

10.
董苑  钱丽萍 《计算机科学》2017,44(Z11):422-427
为了克服传统的文本相似算法缺乏综合考虑语义理解和词语出现频率的缺点,在基于语义词典的词语相似度计算的基础上,提出了一种基于语义词典和词频信息的文本相似度(TSSDWFI)算法。通过计算两文本词语间的扩展相似度,找出文本词语间最大的相似度配对,从而计算出文本间的相似度。这种相似度计算方法利用语义词典,既考虑了不同文本间词语的相似度关系,又考虑了词语在各自文本中的词频高低。实验结果表明,与传统的语义算法和基于空间向量的文本相似度计算方法相比,TSSDWFI算法计算的文本相似度的准确度有了进一步提高。  相似文献   

11.
针对目前情境信息丰富问题语义理解的困难,提出了一种基于语义句模的语义理解方法.该方法借鉴汉语言学中句模的研究成果,以及问题的分类,构建语义句模,将语义信息蕴含在句模中,利用文本中能够穷举的信息,为千变万化的情境信息赋予相应的语义.实验构建了基于自然语言处理工具Gate的语义句模jape规则库,以收集的102道四则运算应用题为例进行语义理解,实验结果为完全理解的题目为82.4%,部分理解为17.6%,完全不理解的0%.得出的实验结论是,该方法能够较好地实现情境信息丰富问题的语义理解.  相似文献   

12.
对文本情感分析中的情感词识别任务进行了研究,提出了综合利用已有各种语言知识以及辞典中的信息和知识来判断识别情感词.在识别中主要借助于不同语义知识词典中提供的词语间的知识和关系,对候选词进行语义归类,并计算情感置信度.实验结果表明,该方法能够很大限度利用手工编撰词典中的权威信息,快速识别文本中的情感词,对于词典中不存在的未登录词也有一定的识别能力.  相似文献   

13.
时间语义层次结构及理解   总被引:4,自引:2,他引:4  
在自然语言处理中,时间是一个重要的语境因素,为了真实反映并准确理解文本中的各级时间语境,本文提出了一种多层次时间语义表达结构,浅层语义结构是时间描述的量化表示,深层语义结构描述时间语境的动态时间属性和事件在给定时区内的状态特征。这样,在多语翻译中,借助这种时间语义表达结构,在分析时能完整记录时间描述信息及风格,在生成时可准确再现原时间量值及其描述风格。同时,本文提供通用的时间语义计算方法,将各语言的时间描述映射到时间轴上。从而准确刻划文本中各事件的时间相关性。这种多层次时间语义表达结构也使复句的时间语过计算变得简单。  相似文献   

14.
平行周遍原则是陈保亚(1999)提出的一种用于区分词与短语的理论,将词语分为既平行又周遍、平行不周遍和不平行不周遍三类,既平行又周遍的是短语,不宜收入词典。由于汉语语义词典在收词时并未严格遵循平行周遍原则,因此依据现有语义词典可以自动地归纳出许多平行周遍规则或者平行不周遍规则。假定有两部语义词典,则可以归纳出两套平行(不)周遍规则,每一套规则都有各自的正例和反例。一个词典中某一规则的反例如果同时是另一词典中的正例,就意味着前一部词典中的词语可能归类不当。基于这一思路,该文提出一个基于平行周遍原则的语义词典归类不当现象自动发现方法,实验结果证明了这一方法的有效性。  相似文献   

15.
基于小规模语料库和机器可读词典的二元分布语义获取   总被引:1,自引:1,他引:1  
本文提出了一种基于小规模语料库和机器可读词典(Machine Readable Dictionary ,MRD)的无指导的动词语义获取方法。该方法不需要使用有义项标注的语料库,而是使用从语料中获得的V+N搭配以及MRD中多义词定义的应用实例中获得的知识。使用两种方法解决数据稀疏问题:首先,将词的相似性度量由直接共现扩展到共现词的共现,以共现聚类而不是共现词来计算词的相似度。其次,从MRD定义中获取名词的IS- A关系。通过这些方法,即使两个词不共享任何词,也可认为是相似的。实验表明,该方法可从很小规模的语料中获取知识,并在不限制词义的情况下达到85.7%的正确排歧率。  相似文献   

16.
傅育熙 《软件学报》1998,9(3):236-240
有归纳类型的马丁洛夫类型理论在经典集合论中有一简单的模型.构造演算不存在经典集合论模型,但在构造集合论中有模型.本文刻画了构造演算中归纳类型的构造集语义.  相似文献   

17.
CCD语义知识库的构造研究   总被引:2,自引:0,他引:2  
CCD(the Chinese Concept Dictionary)是一个WordNet框架下的汉英双语语义知识库(the Chinese—English WordNet).在制定语义规范后,作者提出了构造CCD的演化模型(the model of evolution).新的构造模型强调双语语义知识库构造中的继承(inheritance)和转换(transformation)思想,希望从WordNet现有的英语单语语义信息出发,通过词典编纂者的联机翻译(online translations)和可视化操作(visualized operations).逐步实现由WordNet到CCD的计算性转换,自然地得到一个双语语义知识库,从而大幅度提高构造此类语义知识库的效率和质量.针对该构造模型,作者设计并实现了可视化的辅助词典构造软件VACOL.该软件在北大计算语言所CCD项目中得到大规模的应用,取得了很好的成果.  相似文献   

18.
19.
提出一种基于语义词典的本体对齐框架.首先抽取出代表本体元素的字符串,这些字符串包括本体中的概念、实例、关系等,并利用现有的词典和语义资源将字符串变为词的集合;然后将本体对齐转换为单词集合间的映射,通过多相似度的匹配算法来进行相似度计算,从而实现本体对齐.实验结果表明,所提出的方法是有效的且较之以前的对齐方法有一定的提高.  相似文献   

20.
用语义神经网络实现自然语言理解   总被引:1,自引:0,他引:1  
1.导言   自从以图灵机为数字模型的冯·诺依曼体系计算机诞生以来,符号主义(Symbolism)一直在计算机领域中处于主导地位,同时也取得了巨大的成功,将人类社会带进了信息时代.……  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号