首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
基于向量空间模型的有导词义消歧   总被引:22,自引:1,他引:21  
词义消歧一直是自然语言理解中的一个关键问题,该问题解决的好坏直接关系到自然语言处理中诸多应用问题的效果优劣。由于自然语言知识表示的困难,在手工规则的词义消歧难以达到理想效果的情况下,各种有导机器学习方法被应用于词义消歧任务中,借鉴前人的成果引入信息检索领域中空间模型文档词语权重计算技术来解决多义词义项的知识表示问题,并提出了上下文位置权重的计算方法,给出了一种基于向量空间模型的词义消岐有导机器学习方法。该方法将多义词的义项和上下文分别映射到向量空间中,通过计算多义词上下文向量与义项向量的距离,采用k-NN(k=1)方法来确定上下文向量的义项分类。在9个汉语高频多义词的开放和封闭测试中均取得了突出的成绩(封闭测试平均正确率为96.31%,开放测试平均正确率为92.98%),验证了该方法的有效性。  相似文献   

2.
《软件》2019,(2):11-15
在计算机语言学中,词义消歧是自然语言处理的一个重要问题,词义消歧即指根据上下文确定对象语义的过程,在词义、句义、篇章中都会出现这种词语在上下文的语义环境中有不同的含义的现象。本文提出一种基于神经网络的模型实现词义消歧,将词向量输入神经网络,通过分类的方式实现消歧的目的。实验表明,基于神经网络的词义消歧比传统的统计方法消歧具有更高的准确度。  相似文献   

3.
汉语句子语义极性分析和观点抽取方法的研究   总被引:18,自引:0,他引:18  
娄德成  姚天昉 《计算机应用》2006,26(11):2622-2625
利用自然语言处理技术,对中文网络评论语句进行语义极性分析和观点抽取。提出了计算词语上下文极性的算法,并且分析主题和修饰成分的匹配关系。最后与手工标注结果进行比较,通过实验证明了该算法的合理性和有效性。  相似文献   

4.
一种基于语境的词语相似度计算方法   总被引:1,自引:0,他引:1  
词语相似度计算是机器翻译、信息检索等自然语言处理领域的关键问题之一。传统的词语相似度计算方法,未能很好地考虑上下文信息对词语语义的约束,从而不能对语境变换带来的词语间相似度的差异进行有效的区分。该文引入模糊数学中隶属函数的概念计算词语上下文信息的模糊重要度,并结合基于《知网》的语义相似度计算方法,提出一种基于语境的词语相似度计算方法。实验表明,该算法可以根据语境有效地区分语义相近的词语。  相似文献   

5.
针对基于位置服务中用户位置信息易泄露用户个人隐私的问题,利用Geohash编码优化网格化Casper模型,提出了基于Geohash的位置隐私保护算法G-Casper。该算法采用自底向上的机制,对目标位置的Geohash编码进行字符串模糊查询来确定组成匿名区域的[k-1]个近邻,在扩大扫描区域时,对请求用户所在网格以及周边网格跨域扫描,然后再进行层级的递归,同时使用[Lmax]和[Lmin]两个参数来控制匿名区域范围,最终通过剪枝算法删除冗余网格并随机发送一个候选网格区域代替用户原本位置,达到[k]-匿名的效果。实验结果表明,该算法能够更好地提高位置服务的质量和匿名区域的成功率,并且减少了查询时间和所需储存空间。  相似文献   

6.
词义消歧一直是自然语言处理领域中的重要问题,该文将知网(HowNet)中表示词语语义的义原信息融入到语言模型的训练中。通过义原向量对词语进行向量化表示,实现了词语语义特征的自动学习,提高了特征学习效率。针对多义词的语义消歧,该文将多义词的上下文作为特征,形成特征向量,通过计算多义词词向量与特征向量之间相似度进行词语消歧。作为一种无监督的方法,该方法大大降低了词义消歧的计算和时间成本。在SENSEVAL-3的测试数据中准确率达到了37.7%,略高于相同测试集下其他无监督词义消歧方法的准确率。  相似文献   

7.
汉语缺乏词形变化,语法信息需通过词语搭配关系获得,且在生活中词语通常在搭配中发挥交际作用。因此无论是在语言学本体,还是在自然语言处理的各项任务中,词语搭配知识都尤为重要。各种搭配中,动宾搭配能够反映句子轮廓,并在数量和多样性方面具有优势地位,故该文聚焦于构建现代汉语动宾搭配知识库,以期为自然语言处理提供基础知识,同时也为语言本体研究、语言教学等提供大量实例。该文首先从语言本体的角度出发,总结了动宾搭配的知识体系,并根据该体系制定相应形式化检索式140个,从BCC语料库中抽取动宾搭配知识,并对抽取结果进行了初步消歧,最终获得动宾搭配300万对,形成动宾搭配知识库。  相似文献   

8.
方面级情感分析是自然语言处理的热门研究方向之一,相比于传统的情感分析技术,基于方面的情感分析是细粒度的,能够判断句子中多个目标的情感倾向,能更加准确地挖掘用户对目标的情感极性。针对以往研究忽略目标单独建模的问题,提出了一种基于双向长短期记忆神经网络(BiLSTM)的交互注意力神经网络模型(Bi-IAN)。该模型通过BiLSTM对目标和上下文分别进行建模,获得目标和上下文的隐藏表示,提取其中的语义信息。接下来利用交互注意模块学习上下文和目标之间的注意力,分别生成目标和上下文的表示,捕捉目标和上下文之内和之间的相关性,并重构评价对象和上下文的表示,最终通过非线性层得到分类结果。在数据集SemEval 2014任务4和Chinese review datasets上的实验训练显示,在正确率和F1-score上,比现有的基准情感分析模型有更好的效果。  相似文献   

9.
针对高棉语分词及词性标注问题,提出一种基于层叠条件随机场模型的自动分词及词性标注方法。该方法由三层条件随机场模型构成: 第一层是分词模型,该模型以字符簇为粒度,结合上下文信息与高棉语的构词特点构建特征模板,实现对高棉语句子的自动分词;第二层是分词结果修正模型,该模型以词语为粒度,结合上下文信息与高棉语中命名实体的构成特点构建特征模板,实现对第一层分词结果的修正;第三层是词性标注模型,该模型以词语为粒度,结合上下文信息与高棉语丰富的词缀信息构建特征模板,实现对高棉语句子中的词语进行自动标注词性。基于该模型进行开放测试实验,最终准确率为95.44%,结果表明该方法能有效解决高棉语的分词和词性标注问题。  相似文献   

10.
上下文是统计语言学中获取语言知识和解决自然语言处理中多种实际应用问题必须依靠的资源和基础。近年来基于字的词位标注的方法极大地提高了汉语分词的性能,该方法将汉语分词转化为字的词位标注问题,当前字的词位标注需要借助于该字的上下文来确定。为克服仅凭主观经验给出猜测结果的不足,采用四词位标注集,使用条件随机场模型研究了词位标注汉语分词中上文和下文对分词性能的贡献情况,在国际汉语分词评测Bakeoff2005的PKU和MSRA两种语料上进行了封闭测试,采用分别表征上文和下文的特征模板集进行了对比实验,结果表明,下文对分词性能的贡献比上文的贡献高出13个百分点以上。  相似文献   

11.
基于大规模语料库的汉语词义相似度计算方法   总被引:1,自引:0,他引:1  
词义相似度的计算是自然语言处理领域的关键问题之一,它在信息检索中的查询扩展、机器翻译中的模块识别,以及句法分析、词义消歧等任务中都发挥着重要的作用。该文研究了基于大规模语料库的汉语词义相似度计算方法,系统地比较分析了上下文特征权值的选择、向量相似度计算方法、基于窗口和基于依存关系的表征形式、新闻语体和网络语体的差异。实验结果表明,在网络语言语料上,基于窗口选取上下文特征,用互信息PMI来计算权值,采用cosine来计算相似度,取得了最好的词义相似度结果。  相似文献   

12.
基于本体的语义信息集成能够解决分布环境下异构数据源之间的模式异构,而对于广泛存在的上下文异构却无法解决。由于上下文异构是暗含的语义,无法为信息系统俘获和理解,要解决上下文异构,必须将上下文语义进行形式化描述。本文首先提出了一种将暗含的上下文语义进行形式化描述的方法,然后在此基础上提出了一种基于元数据格式表示的上下文转换方法来解决上下文异构中的格式异构。该方法避免了已有转换方法需要反复定义大量映射的缺点,提高了上下文转换的灵活性、适应性和扩展性。  相似文献   

13.
Concept of combined extraction of topological and directional relations information developed by Zahzah et al. [1] by employing the Allen's temporal relations in 1D spatial domain was improved by Matsakis and Nikitenko [2]. This latter algorithm has high computational complexity due to its limitations of object approximation and segment fuzzification.In this paper, fuzzy Allen relations are used to define the fuzzy topological and directional relations information between different objects. Some extended results of Salamat and Zahzah [3] are discussed. Polygonal object approximation allows us to use fuzzy operators and this approach reduces computational complexity of the method for computing the combined topological and directional relations. To validate the method, some experiments are tested giving satisfactory and promising results. Affine transformation are depicted, these properties will be helpful for using the method in other areas of image analysis such as object tracking.  相似文献   

14.
在自然语言处理研究领域中,句法研究已经取得了可喜的进展,语义研究也日益受到重视。但要真正实现计算机理解自然语言的目标,还必须进一步深入开展语用分析研究,目前还很少有这方面的研究成果。语境是语用学研究中的重要内容,本文首先讨论了现代语言学关于语境的定义,对计算语言学中的语境作了科学的界定,然后给出了语境及其相关概念的形式定义,并结合汉语实例进行了分析。最后指出“计算语用学”这一计算语言学领域中的新兴学科将大有可为。  相似文献   

15.
情感词是情感分析中的基础单元,因此情感词典在情感分析中起着决定性的作用,目前构建情感词典的方法只是用到了单词的语义信息和构词信息,忽略了其所在语境。基于此,对于一些语义未知的词,传统语义方法难以得出其情感权重,而对于一些由于语境变化而产生新用法的词,使用语义方法很难计算出其真实权重。针对这种情况,首先提出了从构字到篇章的情感分析层次体系,每层都有对应到上层的表示方法和情感值计算公式,将分析单元细分到单词维度。在此基础上,提出了基于词语构字和语境的情感语义单元自动构建方法。该方法利用已知情感词典,同时根据情感词的构字和情感词的语境情感倾向计算该词的情感权重,得到的结果更加准确。在社交网络真实数据集上的实验表明,本文方法构建的情感单元较之前的方法在准确率上有3%的提升。同时,情感单元可直接用到情感分析任务中,情感分析的准确率在基于规则的情感分析实验中有9%的提升,在深度学习方法上有3%的提升。  相似文献   

16.
基于语境信息的汉语组合型歧义消歧方法   总被引:2,自引:0,他引:2  
组合型歧义切分字段一直是汉语自动分词的难点,难点在于消歧依赖其上下文语境信息。本文采集、统计了组合型歧义字段的前后语境信息,应用对数似然比建立了语境计算模型,并考虑了语境信息的窗口大小、位置和频次对消歧的影响而设计了权值计算公式。在此基础上,1.使用语境信息中对数似然比的最大值进行消歧;2.使用语境信息中合、分两种情况下各自的对数似然比之和,取值大者进行消歧。对高频出现的14个组合型分词歧义进行实验,前者的平均准确率为84.93%,后者的平均准确率为95.60%。实验证明使用语境信息之和对消解组合型分词歧义具有良好效果。  相似文献   

17.
The development of different help systems and the application of numerous approaches to user support have shown (a) that end-users may encounter insuperably complex use situations, and (b) that it is possible to assist users significantly by implementing computerized help systems. There are many approaches to the realization of user support, varying from the use of natural language to user modelling. However, the current help systems seem to focus on relatively technical data processing issues, ignoring the organizational context in which the use takes place. It is asserted in this paper that it is relevant for users to perceive the organizational context and that it is possible to reflect the context in a support system. Representing the context in a support system is made possible by introducing a context database. A context database is parallel to the actual database and contains information about task flows, task-connected information objects and the like. Therefore the analysis of work and information systems has to be based on related areas. The areas of inquiry are (a) tasks, (b) job design, (c) organization of work, (d) computer applications and (e) information media. The following kinds of mappings can be incorporated within the context database: [organizational unit Ol]-T_person PI in job]-[job task Tl]-[task-connected information Il]-[task-connected information 12]-[job task T2]-[person in job P2]-[organizational unit O2], This type of chain (or parts of it) can then be visualized as context support.  相似文献   

18.
Simulation-and-regression methods have been recently proposed to solve multi-period, dynamic portfolio choice problems. In the constant relative risk aversion (CRRA) framework, the “value function recursion vs portfolio weight recursion” issue was previously examined in van Binsbergen and Brandt [24] and Garlappi and Skoulakis [14]. We revisit this issue in the context of an alternative simulation-and-regression algorithmic approach which does not rely on Taylor series approximations of the value function. We find that, in this context and for the CRRA example examined here, both approach are capable of obtaining precise results, but that the portfolio weight recursion variant of the algorithm provides more accurate results for a similar level of computational complexity, especially for problems with long maturities and large risk-aversion levels.  相似文献   

19.
针对证据理论在决策过程中存在的证据获取困难、证据重要性不同等问题,在决策形式背景框架下构建了一种融合客观数据和先验知识的证据推理模型。该模型将决策形式背景的每个条件属性作为一条证据,同时对决策形式背景所蕴含的知识进行证据提取,获得基本信度指派函数,引入证据权重对合成公式进行修正。仿真结果和相关分析表明,所提方法是合理且有效的。  相似文献   

20.
针对 DRLSE 水平集模型对噪声敏感、依赖初始轮廓位置以及演化速度缓慢等不 足,利用小波变换和小波阈值去噪的方法,构造对噪声不敏感的边缘信息刻画矩阵,定义基于 图像信息的边缘停止函数和自适应权重系数,获得了改进的 DRLSE 水平集图像分割模型。利 用有限差分法对模型求解,并采用 Jaccard 相似度作为评价模型的定量分析方法,数值结果显示 改进的模型及算法对图像分割的有效性,克服了 DRLSE 水平集模型分割含噪图像以及定义初 始轮廓位置的局限性,提高了 DRLSE 水平集模型的计算效率和图像分割精度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号