首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
一种基于语义体系的同义词识别研究   总被引:6,自引:0,他引:6  
针对基于字面和词素相似度识别同义词的不足之处,首次引入《同义词词林》(以下简称《词林》),作为语义体系,提出了基于《词林》语义体系的同义词识别算法,并进行了词汇问的语义相似度度量,实现了同义词识别。实验结果表明,此方法在效率上远高于基于字面、词素相似度识别方法。  相似文献   

2.
关键词提取是文本挖掘领域中研究的核心技术之一.针对影响关键词提取质量的一词多义现象、同义词现象、文章主题准确全面表达的难点,提出了一种基于语义的关键词提取方法 KETCLC,将《同义词词林》语义词典和词汇链方法相结合,对文本分别作预处理、多义词词义消歧、同义词合并、词汇链构建、有效特征选取及对权重综合计算改进的处理,提取出的关键词不仅避免了同义词冗余表达,而且较准确全面地覆盖文本的主题.实验结果表明:基于KETCLC方法比基于TFIDF以及基于词汇链的方法具有较优的提取效果,具有一定的实际应用价值.  相似文献   

3.
英语中存在着大量的同义词,传统的同义词辨析方法多依赖于直觉经验,采用内省的定性方法,对同义词的词目意义逐条分析;语料库语言学研究的发展与深入为同义词的比较提供了一个全新的解决办法。语料库索引可为同义词提供丰富的用法和语境,使学习者能够比较和掌握同义词之间细微的语义语用差异。  相似文献   

4.
基于PageRank算法的汉语同义词自动识别   总被引:2,自引:0,他引:2  
同义词的自动发现和识别在信息检索领域有着重要的研究意义和应用价值.为了提高同义词自动识别的效率,本文提出了基于PageRank算法的汉语同义词自动识别方法.该方法把词汇之间解释与被解释的关系看成是一种超链接,把PageRank值看成是体现词汇之间语义相似性的衡量指标,然后根据语义相似度的大小识别同义词.通过算法提取测试,结果表明:利用基于PageRank算法来自动发现和识别同义词具有可行性和实用性.  相似文献   

5.
基于实体词语义相似度的中文实体关系抽取   总被引:1,自引:1,他引:0  
为了探索语义相似度在中文实体关系抽取上的作用,提出由实体词在《同义词词林》中的5层编码构建成的《同义词词林》编码树和由关系实例中的实体词,各个类别中所有实体词计算相似度后求得的平均值构建成的实体词语义相似度树2种新特征,并连同已有的《同义词词林》编码、实体类型信息共4种特征探究其对抽取性能的影响。单一特征的试验中,实体类型特征效果最好,F值达到了小类84.9、大类83.2;组合特征的试验中,实体类型和《同义词词林》编码树的组合特征效果最好,大类小类的F值都比实体类型特征提高了2.5,3种组合特征性能不升反降。试验结果表明《同义词词林》编码树是对实体类型的有效补充,但过多的特征会造成信息冗余,使抽取性能下降。  相似文献   

6.
本讨论了理论的发展与词典编纂的关系,特别是同义词的定义在词典中的反映。指出两之间关系的讨论对于语言的研究和教学都有裨益。  相似文献   

7.
在自然语言中,动词的用法主要包含3种:字面、转喻和隐喻.动词的隐喻用法在隐喻的研究中占有重要的地位.动词的隐喻计算包含两个子任务:隐喻识别和隐喻理解.本文采用条件随机场、最大熵模型来识别动词的隐喻搭配,并在此基础上,加入了两种语义信息:《同义词词林》的同义词信息和《知网》的语义信息来识别动词的隐喻表达,实验识别正确率可...  相似文献   

8.
基于同义词词林的词语相似度计算方法   总被引:1,自引:0,他引:1  
为解决词语相在语义网自适应学习系统中相似度计算不清的问题,以同义词词林为基础,提出并实现了一种基于同义词词林的词语相似度计算方法,充分分析并利用了同义词词林的编码及结构特点。该算法同时考虑了词语的相似性,和词语的相关性。进行人工测试,替换测试以及与当前流行的基于"知网"的词语相似度算法对比测试的结果表明,该算法与人们思维中的相似度值基本一致,有较高的准确性。  相似文献   

9.
对外汉语教学中的同义词辨析因教学对象是对汉语及其文化环境不熟悉的外国留学生而有其特殊性。在掌握一般辨析方法外,还要考虑学生的第一语言、文化环境以及差异等。同时,同义词的范围也可以适当扩大,因为许多母语是汉语的人不认为是同义词或没有意识到意义上有联系的词语,学生可能会混淆和误用。而且有的惯用语、短语等不属于词的结构,也可以包括在同义词辨析的范围之内。同义词的辨析方法有很多种,文章从语义、语法和语用三个方面进行了辨析。在辨析时,教师应选择同义词之间最明显最主要的区别进行讲解,这不仅可以减轻学生的学习负担,而且可以提高学习的效率。  相似文献   

10.
本文从语言学角度对英语专业四级考试中词汇部分所涉及的同义词进行分类研究,目的是引导学生掌握其在具体语言环境中的细微差异,为学生进行同义词的比较提供一些参考。  相似文献   

11.
针对元数据方式管理教学资源的不足,提出一种基于本体和元数据的语义检索系统的框架,讨论了如何构建本体模型,制定元数据方案,设计语义检索机制等问题,并给出了系统实现的方法。  相似文献   

12.
语义信息具备高度抽象、智能简约等特性,语义通信引入语义新维度,关注信息内容而非编码符号,将有效提高信息的传输效率。随着人工智能与通信技术的深度融合,语义通信得到学术界和工业界广泛关注,将有助于解决智能机器通信中超大规模连接、巨量数据传输等难题,对实现机器间高效通信发挥重要作用。以信息论为基础、人工智能方法为指导,概述端到端语义通信系统设计方法,总结分析了语义信息的刻画及度量、语义信息编解码方法和语义通信系统评价指标。  相似文献   

13.
可扩展标记语言XML已经成为数据交换的重要格式,对XML节点语义的研究具有重要的现实意义。本文首先对语义在信息检索中的应用进行了综述,介绍了目前基于统计的语义方法,还阐述了XML文档的结构语义,最后指出了XML节点语义的研究方向。  相似文献   

14.
语义异构问题是当前信息集成领域的研究热点。本文讨论了信息集成的方法及其存在的一些问题,介绍了本体的概念、本体在信息集成中的角色,提出了一种基于本体的信息集成架构,旨在实现对语义异构信息源的集成。  相似文献   

15.
文章意义段划分的数学模型   总被引:1,自引:0,他引:1  
提出自动划分文章意义段的六条规则,给出了其实现算法。实验表明,该方法较好地反映了文章的客观结构,也为自然语言处理领域提供了一些有用的信息。  相似文献   

16.
基于PSL的制造过程信息描述方法研究   总被引:1,自引:0,他引:1  
为解决企业制造过程信息的描述和交互问题,提出了一种基于可扩展标记语言(XML)的过程描述元模型。在该模型中,定义了基于过程描述语言(PSL)本体的语义映射规则及映射的具体过程,对过程描述语言本体进行了语义分析,实现了对过程信息的语义层次描述;借助可扩展标记语言的语法结构,建立基于可扩展标记语言的过程描述语言核心元素的描述规则.并作为过程信息语法层次描述的统一标准,实现过程信息在语法层次的信息转换。最后,通过具体的可选工艺信息描述实例,验证了该模型及实现方法的有效性和可行性。  相似文献   

17.
为了使个性化虚拟人更加形象生动,能根据用户输入的文本做出表情动作,运用自然语言处理技术对中文和英文文本进行语义和分类处理,分析出动作和情感信息。采用潜在语义方法从文本中提取出动作语义信息,利用hownet计算词汇相似度,使用K最近邻方法将文本情感信息分为6类:愤怒、厌恶、恐惧、喜悦、悲伤和惊讶。实验结果为:语料文本分类准确率为87.5%,系统能从用户输入的文本中提取出情感、动作信息,使虚拟人做出相应表情变化。  相似文献   

18.
万维网(World Wide Web,WWW)现在已经成为一个巨大的信息发布平台,理论上,人们可以找到任何感兴趣的信息。问题是目前的信息检索效率很低,通过传统基于关键词匹配的信息检索通常检索到大量不相关的冗余信息。由B.Lee 1998年提出的语义网,被称为下一代网络,将会对信息检索起到根本性的改变,而语义网中语义元数据是其中的核心基础。本文设计并实现了一种基于Ontology的网络元数据抽取系统。它使得用户可以构建和维护领域本体,对网页、PDF文件以及图像等网络资源进行元数据标注,然后基于构建的Ontology对标注过的网络资源进行元数据抽取,并且将抽取的各类元数据以统一的格式存储到元数据信息库中。  相似文献   

19.
智能拼音-汉字转换系统实现研究   总被引:3,自引:0,他引:3  
本拼音 -汉字智能转换系统的主要特征 ,是利用扩充的LR句法分析和基于二元语义的类属语义分析方法消除同音词的歧义干扰 ,提高转换的正确率 针对汉语语法特征 ,阐述了汉语语法分析中的两种回溯 ,并扩展了传统LR分析方法 ,提高了语法分析的完备性 为有效地实施语义分析 ,探讨了所使用的类属及类属关系 ,它以一种简单而有效的方式建立、维护和使用句法和语义知识 随着句法和语义知识的不断丰富完善 ,系统将有望大大提高转换的效果  相似文献   

20.
根据飞机维修的需求及维修案例知识的特点,重点研究了飞机故障维修案例的知识表示、知识分类、案例检索及语义匹配等技术;设计了飞机故障维修案例本体知识的模型并通过Protégé加以实现;结合本体论在信息检索中的应用,采用语义检索开发了基于本体的案例知识搜索匹配系统。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号