首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 62 毫秒
1.
词义消歧和词义消歧评测简介   总被引:1,自引:0,他引:1  
词义消歧是自然语言处理的基础研究之一。本文简要地介绍了词义消歧的研究目的、研究内容、研究方法(特别是基于机器学习的方法)和研究历程,以及当前词义消歧所面临的主要问题;接下来比较详细地介绍词义消歧相关的国际评测。最后对全文做出总结。  相似文献   

2.
词义消歧一直是信息检索领域的关键问题和难点之一。统计学方法以其良好的词义消歧效果逐渐占据主流地位。文章结合义类词典HowNet,分别采用隐马尔可夫模型,贝叶斯模型,基于依存关系改进贝叶斯模型对大规模真实文本进行了词义消歧研究,其中基于依存关系改进贝叶斯模型的词义消歧效果最好。  相似文献   

3.
为了提高词义消歧性能,提出了一种基于卷积神经网络的消歧方法.以歧义词为中心,向左右两侧连续扩展4个邻接词汇单元,选取其中的词形、词性和语义类作为消歧特征.以消歧特征为基础,使用卷积神经网络来确定歧义词的语义类别.利用SemEval-2007:Task#5的训练语料和哈尔滨工业大学语义标注语料来优化卷积神经网络.使用SemEval-2007:Task#5的测试语料来测试词义消歧分类器的性能,所提方法的消歧平均准确率有提高.实验结果表明,该方法在词义消歧中是可行的.  相似文献   

4.
词义消歧是计算语言学领域的基础性关键研究课题。本文介绍了与词义消歧相关的一些重要术语概念,包括词义消歧、词义区分、基于词典的词义消歧方法、有监督的词义消歧方法、词义标注语料库等。  相似文献   

5.
词义消歧一直是信息检索领域的关键问题和难点之一。统计学方法以其良好的词义消歧效果逐渐占据主流地位。文章结合义类词典HowNet,分别采用隐马尔可夫模型,贝叶斯模型,基于依存关系改进贝叶斯模型对大规模真实文本进行了词义消歧研究,其中基于依存关系改进贝叶斯模型的词义消歧效果最好。  相似文献   

6.
可拓学研究中的若干问题   总被引:17,自引:1,他引:17       下载免费PDF全文
根据目前可拓学研究的进展 ,分析可拓论研究中的几个本质性问题和可拓学研究必须注意的若干问题 ,并列出了目前可拓学研究的主要方向 .  相似文献   

7.
8.
可拓集合的新定义   总被引:12,自引:0,他引:12  
分析可拓集合概念逐步发展的必然性,给出可拓集合的新定义,并说明新定义的应用价值。  相似文献   

9.
针对已有的词义消歧研究方法的不足,在分析了多种不同结构知识词典的可计算性及其计算复杂度之后,选择北大计算语言所的《现代汉语语法信息词典》和《现代汉语语义词典》,并结合已经标注了词义的人民日报语料作为词义消歧知识源,从中获取汉语词义消歧所需要的统计知识和规则知识,并采用统计与规则相结合的方法构建词义消歧模型,取得了比较满意的词义消其效果.  相似文献   

10.
11.
The input of a network is the key problem for Chinese word sense disambiguation utilizing the neural network. This paper presents an input model of the neural network that calculates the mutual information between contextual words and the ambiguous word by using statistical methodology and taking the contextual words of a certain number beside the ambiguous word according to ( - M, + N). The experiment adopts triple-layer BP Neural Network model and proves how the size of a training set and the value of M and N affect the performance of the Neural Network Model. The experimental objects are six pseudowords owning three word-senses constructed according to certain principles. The tested accuracy of our approach on a closed-corpus reaches 90. 31% , and 89. 62% on an open-corpus. The experiment proves that the Neural Network Model has a good performance on Word Sense Disambiguation.  相似文献   

12.
0 INTRODUCTIONThetaskofwordsensedisambiguationistoassignasenseofapolysemouswordtoaspecificcontext.Itisjustapieceofcakeformostofus .Butevennowadays,thistaskistoohardforacomputertofindanappliedmethodforrealapplications.Itisnowanderthatsomeresearchersnamed…  相似文献   

13.
有导词义消歧机器学习方法由于需要大量人力进行词义标注,难以适用于大规模词义消歧任务.提出一种避免人工词义标注的无导消歧方法.该方法综合利用WordNet知识库中的多种知识源(包括:词义定义描述、使用实例、结构化语义关系、领域属性等)描述歧义词的词义信息,生成词义的“代表词汇集”和“领域代表词汇集”,结合词汇的词频分布信息和所处的上下文环境进行词义判定.利用通用测试集Senseval 3对6个典型的无导词义消歧方法进行开放实验,该方法取得平均正确率为49.93%的消歧结果.  相似文献   

14.
综合考察了贝叶斯模型、决策树模型、向量空间模型、最大熵模型在汉语词义消歧上的应用,并对它们的消歧效果进行比较,为词义消歧模型的选择与应用奠定基础。  相似文献   

15.
刘挺  卢志茂  李生 《哈尔滨工业大学学报》2005,37(12):1603-1605,1649
为研究在给定上下文中如何确定多义词的词义,介绍了一种无指导的词义消歧技术和一个汉语全文词义标注系统的设计实现过程.该系统基于贝叶斯模型,使用大规模语料进行训练,较好地解决了知识获取中数据稀疏的问题.该系统具有标注正确率高和运行速度快等特点,适合大规模文本的词义标注工作.  相似文献   

16.
词语义项标注在自然语言处理领域占有重要地位.词义排歧知识的获取、基于排歧知识构建词义标注的语言模型,以及对所构建模型性能的评价就成为词语义项标注系统的三个核心问题,尤其是前两个问题非常重要,难度也很大.为更好地研究这些问题,设计并实现了一个面向词语义项标注研究的试验软件平台,应用该软件平台,很容易实现对不同语言模型、知识获取算法的试验与比较,且在模型确定之后,稍作改进,该实验系统就能成为一个功能完善的自动标注软件系统.试验表明,该平台对汉语词义标注的研究是有用的.  相似文献   

17.
词义消歧(WSD)一直是自然语言理解中的一个关键问题,该问题解决的好坏直接关系到自然语言处理中诸多应用问题的效果优劣。本文对大规模真实文本进行了词义消歧研究,采用了基于依存分析改进贝叶斯分类模型的有指导词义消歧方法。  相似文献   

18.
针对开放文本中中文实体关系抽取的一词多义问题,提出一种基于实体消歧的中文实体关系抽取方法。首先,从知网中挖掘出具有潜在语义关系的实体对,并利用贝叶斯分类的语义消歧方法实现从知网到维基百科的实体映射,以获取高质量的关系实例;然后,根据这些关系实例抽取出其对应文本中共现的句子实例,构建基本的抽取模式;最后通过模式合并的方法生成新模式,再使用新模式来抽取新实例。实验结果表明,该方法与没有进行语义消歧和模式合并的方法相比准确率有所提高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号