期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

全昌勤何婷婷姬东鸿余绍文《计算机研究与发展》2006,43(5):933-939

词义消歧问题可以形式化为典型的分类问题.通过学习少量带有词义标注的语料构造多个消歧分量分类器,并利用未标语料动态地对这些分类器进行更新,根据最终分量分类器分别对多义词义项的判定结果,组合决策多义词的义项.该方法无需手工构造大规模具有词义标注的语料库,并且具有较高的消歧准确率. 相似文献

2.

基于意识知识的消歧体系

杨莹李应潭《中文信息学报》1993,7(1):40-47

相似文献

3.

基于指示词的词义消歧方法

全昌勤何婷婷姬东鸿刘辉《计算机工程》2005,31(16):48-50

影响词义消歧的特征是多方面的，为考察上下文指示词这一消歧特征，提出了利用统计的方法抽取指示词用于词义消歧。实验表明，该方法是可行的，并为利用多特征进行汉语自动消歧提供了可靠的参考。相似文献

4.

基于多知识源的词汇消歧一体化处理 总被引：1，自引：0，他引：1

郭宏蕾姚天顺《小型微型计算机系统》1999,20(7):531-535

词汇消歧是语言分析的基石,本文提出一种基于多知识源的词汇消歧一体化处理机制,该机制充分利用了知识库和文本结构的信息,以句法标签、词频、搭配、上下文语义,语义可选约束,句法线索等知识源为消歧指示器相似文献

5.

基于词典属性特征的粗粒度词义消歧

吴云芳金澎郭涛《中文信息学报》2007,21(2):1-8

本文依据《现代汉语语法信息词典》中对词语多义的属性特征描述,对《人民日报》语料中155 个词语共 4 996 个同形实例进行了粗粒度词义自动消歧实验,同时用贝叶斯算法进行了比较测试。基于词典属性特征的消歧方法在同形层面上准确率达到 90%, 但召回率偏低。其优点在于两个方面: 1) 不受词义标注语料库规模的影响;2) 对特定词语意义的消歧准确率可达到100%。本文也讨论了适用于不同词类的消歧特征。相似文献

6.

无监督词义消歧研究 总被引：3，自引：0，他引：3

王瑞琴孔繁胜《软件学报》2009,20(8):2138-2152

研究的目的是对现有的无监督词义消歧技术进行总结,以期为进一步的研究指明方向.首先,介绍了无监督词义消歧研究的意义.然后,重点总结分析了国内外各类无监督词义消歧研究中的各项关键技术,包括使用的数据源、采用的消歧方法、评价体系以及达到的消歧效果等方面.最后,对14个较有特色的无监督词义消歧方法进行了总结,并指出无监督词义消歧的现有研究成果和可能的发展方向. 相似文献

7.

基于神经网络的词义消歧

《软件》2019,(2):11-15

在计算机语言学中,词义消歧是自然语言处理的一个重要问题,词义消歧即指根据上下文确定对象语义的过程,在词义、句义、篇章中都会出现这种词语在上下文的语义环境中有不同的含义的现象。本文提出一种基于神经网络的模型实现词义消歧,将词向量输入神经网络,通过分类的方式实现消歧的目的。实验表明,基于神经网络的词义消歧比传统的统计方法消歧具有更高的准确度。相似文献

8.

词义消歧研究的现状与发展方向

李生张晶《计算机科学》2001,28(9):95-98

1 词义消歧及其应用词义是词汇在一定的语言环境下反映的特定语言现象。它能够明确地表达该词汇在该语境下表达的语义属性如感知、行为和情绪等;表达该词汇与相关词汇之间的关系;并且表达该词汇所特有的知识及常识性的知识。透过词义,人们将能运用自己的思维描述该语言现象,对其进行推理,或者为指代词从上下文中找到指代物。在自然语言中,一个词汇往往存在多个词义,称为词的多义性。例如:Bank有“银行”、“河岸”的意思。但是当词汇处于一定的语言环境,则只有唯一的意思。例如;“He slipped down the bank”中,bank的意思是“河岸”。词义消歧就是使计算机自动为词汇选择正确意思,是自然语言处理领域中词汇级别上的最大难题。词义消歧不是自然语言处理的最终目的,而是自然语言处理中不可缺少的一个环节。其应用至少包括下述领域: 相似文献

9.

基于《知网》的汉语词语词义消歧方法

孙继明李舟军文健《计算机与信息技术》2007,(3)

本文提出了一种简单有效的词义消歧方法,该模型充分利用依存文法分析,从句子的内部结构,寻找词语之间支配与被支配的关系,借以确定能够对词语语义构成内在限制的词语。借助《知网》系统的实体关系,并结合与该岐义词相关联词语的义项,计算歧义词的义项权重,从而根据义项权重大小来判断歧义词的词义。相似文献

10.

英语语音合成中基于WordNet的多音词消歧算法

下载免费PDF全文

王永生李梅《计算机工程与应用》2008,44(26):138-140

英语中的多音词分成两类,一是因词性不同而读音不同,一是因词义不同而读音不同。前者只需经词性标注,根据其词性标记就可判别其正确的读音。而后者则复杂得多,论文采用了一种基于WordNet语义信息的多音词消歧算法,该算法将多音词的语义信息与上下文中词的语义信息进行匹配,根据匹配结果来判别多音词的读音。相似文献

11.

基于义原同现频率的汉语词义排歧系统

刘亚清张瑾于纯妍《微机发展》2006,16(5):184-185

词义排歧在自然语言处理领域占有重要地位。词义排歧的精确率依赖于排歧知识的完备性。但是目前使用的基于词典的和基于语料库的词义排歧方法来获取排歧知识的效果都不令人满意。文中借助《知网》,以义原同现频率矩阵作为排歧知识,在其基础上设计并实现了一个基于义原同现频率的汉语词义排歧系统,大大地提高词义排歧的精确率。相似文献

12.

基于词典信息的先秦汉语全文词义标注方法研究

张颖杰李斌陈家骏陈小荷《中文信息学报》2012,26(3):65-72

词义消歧是自然语言处理中的一项基础任务,古汉语信息处理也急需深层次的语义标注工作。该文针对先秦古汉语这一特殊的语言材料,在训练语料和语义资源匮乏的条件下,采用《汉语大词典2.0》作为知识来源,将其词条释义作为义类,每个义项的例句作为训练语料,使用基于支持向量机(SVM)的半指导方法对《左传》进行全文的词义标注。按照频度不同、义项数量不同的原则,我们随机选取了22个词进行了人工检查,平均正确率达到67%。该方法可以广泛用于缺乏训练语料的古汉语义项标注工作,能够在古汉语全文词义标注的起步阶段提供初始结果,为人工标注词语义项提供良好的数据底本,补正传统词典释义不全的问题,进一步丰富汉语史发展研究资料。相似文献

13.

基于对数模型的词义自动消歧 总被引：9，自引：0，他引：9

朱靖波李珩张跃姚天顺《软件学报》2001,12(9):1405-1412

提出了一种对数模型(logarithmmodel,简称LM),构造了一个词义自动消歧系统LM-WSD(wordsensedisambiguationbasedonlogarithmmodel).在词义自动消歧实验中,构造了4种计算模型进行词义消歧,根据4个计算模型的消歧结果,分析了高频率词义、指示词、特定领域、固定搭配和固定用法信息对名词和动词词义消歧的影响.目前,该词义自动消歧系统LM-WSD已经应用于基于词层的英汉机器翻译系统(汽车配件专业领域)中,有效地提高了翻译性能. 相似文献

14.

Combining Supervised and Unsupervised Lexical Knowledge Methods for Word Sense Disambiguation

E. Agirre G. Rigau L. Padró J. Atserias 《Computers and the Humanities》2000,34(1-2):103-108

This work combines a set of available techniques – whichcould be further extended – to perform noun sense disambiguation. We use several unsupervised techniques (Rigau et al., 1997) that draw knowledge from a variety of sources. In addition, we also apply a supervised technique in order to show that supervised and unsupervised methods can be combined to obtain better results. This paper tries to prove that using an appropriate method to combine those heuristics we can disambiguate words in free running text with reasonable precision. 相似文献

15.

基于语义计算的中文歧义字段消歧算法

DENG Fan YU Bin 《微机发展》2008,18(6):107-110

针对中文中歧义字段对中文处理及理解带来的诸多问题提出了一种基于自然语言理解的中文汉字歧义消除算法。对于交集型歧义和组合型歧义,利用《知网》为主要语义资源,以知识图知识表示方法,通过提出的字段消歧算法,对歧义字段以及上下文的语义进行计算,从而选出正确的句子切分方案,达到消除歧义的目的。经过实验数据表明本算法提高了中文歧义字段歧义切分的正确率。相似文献

16.

汉语词义排歧的另一种方法

张瑾刘亚清于纯妍《小型微型计算机系统》2006,27(4):724-726

针对传统的基于义原同现频率的汉语词义排歧方法存在“盲目性”的不足，笔者根据《知网》中对概念定义的描述，分别计算多义词的每个义项与特征词的第一独立义原、其他独立义原、关系义原、符号义原之间的相关系数；最后通过比较多义词的每个义项与特征词之间的相关系数来决定多义词的义项．经过实验验证，该方法进一步提高了词义排歧的效果．相似文献

17.

基于神经网络的汉语口语多义选择

王海峰高文李生《软件学报》1999,10(12):1279-1283

汉语口语分析是交互式话语处理中的重要环节.在汉语中,有意义的最小单位是词,因此多义选择是口语分析系统必须首先解决的问题.该文提出了一种基于精简循环网络的汉语口语多义选择方法,并从词汇的语法、语义分类所固有的内在联系出发,给出了语法、语义的一致化处理策略.通过使用会面安排领域的口语语料进行实验,多义选择的开放测试的正确率为96.9%. 相似文献