首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到15条相似文献,搜索用时 125 毫秒
1.
词义消歧是计算语言学领域的基础性关键研究课题。本文介绍了与词义消歧相关的一些重要术语概念,包括词义消歧、词义区分、基于词典的词义消歧方法、有监督的词义消歧方法、词义标注语料库等。  相似文献   

2.
词义消歧和词义消歧评测简介   总被引:1,自引:0,他引:1  
词义消歧是自然语言处理的基础研究之一。本文简要地介绍了词义消歧的研究目的、研究内容、研究方法(特别是基于机器学习的方法)和研究历程,以及当前词义消歧所面临的主要问题;接下来比较详细地介绍词义消歧相关的国际评测。最后对全文做出总结。  相似文献   

3.
针对当前FrameNet框架下的词义消歧准确率较低的问题,采用卷积神经网络应用于FrameNet框架进行框架消歧研究.该模型依托依存句法分析树排序选出待消歧词的6个邻接单词节点,并选择单词词义、父节点词义、单词词性、单词依存分析类型作为消歧特征,使用Softmax函数作为全连接层分类器,通过输出待消歧词可激活的各框架概率选出概率值最高的作为激活框架,从而判定待消歧词词义.实验结果表明,该模型在FrameNet框架的消歧准确率较高于条件随机场等其他普遍算法,各目标词的准确率较为稳定,通过该模型切实提升了FrameNet框架消歧的准确率.  相似文献   

4.
作为自然语言处理的一项基础性研究,词义消歧对机器翻译、信息检索、文本分类、情感分析等上层应用有重要影响。本文针对现有消歧方法中存在的对知网知识利用不充分问题,提出了一种基于How Net的图模型词义消歧方法。该方法利用依存句法分析获取上下文知识,构建上下文消歧图,并对How Net中有着重要词义区分能力的例句进行依存句法分析,构建依存消歧图,结合上下文消歧图和依存消歧图完成歧义词的消歧处理。实验结果表明,该方法在Sem Eval-2007 task#5数据集上取得了0.468的消歧准确率,获得优于同类方法的消歧效果。  相似文献   

5.
词义消歧一直是信息检索领域的关键问题和难点之一。统计学方法以其良好的词义消歧效果逐渐占据主流地位。文章结合义类词典HowNet,分别采用隐马尔可夫模型,贝叶斯模型,基于依存关系改进贝叶斯模型对大规模真实文本进行了词义消歧研究,其中基于依存关系改进贝叶斯模型的词义消歧效果最好。  相似文献   

6.
针对已有的词义消歧研究方法的不足,在分析了多种不同结构知识词典的可计算性及其计算复杂度之后,选择北大计算语言所的《现代汉语语法信息词典》和《现代汉语语义词典》,并结合已经标注了词义的人民日报语料作为词义消歧知识源,从中获取汉语词义消歧所需要的统计知识和规则知识,并采用统计与规则相结合的方法构建词义消歧模型,取得了比较满意的词义消其效果.  相似文献   

7.
词义消歧一直是信息检索领域的关键问题和难点之一。统计学方法以其良好的词义消歧效果逐渐占据主流地位。文章结合义类词典HowNet,分别采用隐马尔可夫模型,贝叶斯模型,基于依存关系改进贝叶斯模型对大规模真实文本进行了词义消歧研究,其中基于依存关系改进贝叶斯模型的词义消歧效果最好。  相似文献   

8.
提出了一种基于语义网络结构的词义消歧方法。将文本片段中出现词的所有词义都看作节点,将两个词的任意两个词义之间的语义关系看作弧,将语义关系的紧密程度看作弧的权重,从而构成一个无向赋权网络;将Google的网页分级(PageRank)算法应用到无向赋权图中,评价网络中节点的重要性,并结合共指词义和词义的常用程度,对文本中出现的名词进行消歧。实验证明了该方法对文本进行词义消歧是有效的。  相似文献   

9.
综合考察了贝叶斯模型、决策树模型、向量空间模型、最大熵模型在汉语词义消歧上的应用,并对它们的消歧效果进行比较,为词义消歧模型的选择与应用奠定基础。  相似文献   

10.
提出了一种基于语义网络结构的词义消歧方法。将文本片段中出现词的所有词义都看作节点,将两个词的任意两个词义之间的语义关系看作弧,将语义关系的紧密程度看作弧的权重,从而构成一个无向赋权网络;将Google的网页分级(PageRank)算法应用到无向赋权图中,评价网络中节点的重要性,并结合共指词义和词义的常用程度,对文本中出现的名词进行消歧。实验证明了该方法对文本进行词义消歧是有效的。  相似文献   

11.
词语义项标注在自然语言处理领域占有重要地位.词义排歧知识的获取、基于排歧知识构建词义标注的语言模型,以及对所构建模型性能的评价就成为词语义项标注系统的三个核心问题,尤其是前两个问题非常重要,难度也很大.为更好地研究这些问题,设计并实现了一个面向词语义项标注研究的试验软件平台,应用该软件平台,很容易实现对不同语言模型、知识获取算法的试验与比较,且在模型确定之后,稍作改进,该实验系统就能成为一个功能完善的自动标注软件系统.试验表明,该平台对汉语词义标注的研究是有用的.  相似文献   

12.
为了提高词义消歧性能,提出了一种基于卷积神经网络的消歧方法.以歧义词为中心,向左右两侧连续扩展4个邻接词汇单元,选取其中的词形、词性和语义类作为消歧特征.以消歧特征为基础,使用卷积神经网络来确定歧义词的语义类别.利用SemEval-2007:Task#5的训练语料和哈尔滨工业大学语义标注语料来优化卷积神经网络.使用SemEval-2007:Task#5的测试语料来测试词义消歧分类器的性能,所提方法的消歧平均准确率有提高.实验结果表明,该方法在词义消歧中是可行的.  相似文献   

13.
有导词义消歧机器学习方法由于需要大量人力进行词义标注,难以适用于大规模词义消歧任务.提出一种避免人工词义标注的无导消歧方法.该方法综合利用WordNet知识库中的多种知识源(包括:词义定义描述、使用实例、结构化语义关系、领域属性等)描述歧义词的词义信息,生成词义的“代表词汇集”和“领域代表词汇集”,结合词汇的词频分布信息和所处的上下文环境进行词义判定.利用通用测试集Senseval 3对6个典型的无导词义消歧方法进行开放实验,该方法取得平均正确率为49.93%的消歧结果.  相似文献   

14.
基于可拓学理论的汉语词义消歧   总被引:1,自引:0,他引:1  
卢志茂  刘挺  李生 《哈尔滨工业大学学报》2006,38(12):2026-2029,2035
应用可拓学原理,对歧义词进行可拓分解、可拓置换等可拓变换,为歧义词的各个词义建立相应的可拓集合,利用可拓集合中义原词语从大规模语料中自动获取歧义词的语言信息,建立无指导的词义消歧模型.该方法克服了从无词义标注语料中获取词义消歧知识的难题.实验证明,该方法用于汉语的词义消歧切实可行,平均正确率达到90.16%.  相似文献   

15.
刘挺  卢志茂  李生 《哈尔滨工业大学学报》2005,37(12):1603-1605,1649
为研究在给定上下文中如何确定多义词的词义,介绍了一种无指导的词义消歧技术和一个汉语全文词义标注系统的设计实现过程.该系统基于贝叶斯模型,使用大规模语料进行训练,较好地解决了知识获取中数据稀疏的问题.该系统具有标注正确率高和运行速度快等特点,适合大规模文本的词义标注工作.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号