共查询到19条相似文献,搜索用时 140 毫秒
1.
根据现代汉语中指示代词和所指对象的位置关系,指代一般可分为3种类型:前指、后指和外指。针对前指型指示代词的“代名词”形式,分析代词的指代特点,以概念格(本体)为理论基础,建立概念从属树及名词概念的描述,表示概念之间的属性继承关系,进行无语义转换统一体内的代词先行词确定的研究,实现了其中用“就近概念从属匹配”原则确定先行词的部分,体现了代词的语义功能,并在初中几何智能解题系统中得到了成功应用。 相似文献
2.
采用优先选择策略的中文人称代词的指代消解 总被引:9,自引:4,他引:9
指代是自然语言中常见的语言现象,指代消解是文本信息处理中的一个重要任务。随着篇章处理相关应用日益广泛,指代消解也显示出前所未有的重要性。本文针对中文人称代词的指代特点,提出了一种基于语料库的,运用决策树机器学习算法并结合优先选择策略,进行指代消解的方法。该方法充分考虑了与指代相关的若干属性,及相互之间的影响。实验表明,对中文人称代词的消解特别是第三人称的消解获得了一定的效果。 相似文献
3.
4.
张文艳李存华仲兆满王艺李莉 《数据采集与处理》2017,32(1):149-156
指代消解是一种为了确定文章中出现的指代词与前文中出现的内容是否为同一事物的技术,在海量信息文本智能处理中具有重要的作用,而人称代词在各种指代词集合中占有相当一部分比例。本文采用规则与语义相结合的方法对中文人称代词进行指代消解,在基础的语法过滤规则之上新增同位语规则过滤指代词的候选消解项;提出更精确的同义词距离计算方法,利用同义词词林和知网对人称代词的关联词与候选先行词的关联词进行语义关系计算,选择关联度最高的候选先行词作为最终的指代结果。通
过不同方法的对比实验和在真实语料数据集上的实验表明,本文所提方法获得了较好的效果。 相似文献
5.
6.
7.
实体指代识别(Entity Mention Detection, EMD)是识别文本中对实体的指代(Mention)的任务,包括专名、普通名词、代词指代的识别。本文提出一种基于多层次特征集成的中文实体指代识别方法,利用条件随机场模型的特征集成能力,综合使用字符、拼音、词及词性、各类专名列表、频次统计等各层次特征提高识别性能。本文利用流水线框架,分三个阶段标注实体指代的各项信息。基于本方法的指代识别系统参加了2007年自动内容抽取(ACE07)中文EMD评测,系统的ACE Value值名列第二。 相似文献
8.
鲁棒性的汉语人称代词消解 总被引:17,自引:2,他引:15
指代消解在自然语言处理中起着越来越重要的作用.许多自然语言处理应用系统都需要高效、鲁棒的指代消解策略.然而,传统的指代消解方法需要用到句法知识、语义知识、上下文知识,甚至领域知识等多级知识,在目前的自然语言处理水平下,要有效获取这些知识是相当困难的.结合汉语的特点,提出了一种弱化语言知识的人称代词消解方法,仅仅用到了单复数特征、性别特征和语法角色特征.该方法主要分为两步,首先,利用这3种特征的简单约束关系,过滤与人称代词特征不一致的词,并形成可能的先行语候选集;然后,使用一个权值算法,计算候选的权值,并将最高权值的候选作为代词最终的先行语.权值算法并不是枚举式地计算每个候选的权值,而会通过动态评测机制,在合适的条件下自动终止计算,因而有效地控制了计算复杂度.此外,该方法不需要对文本进行深层的分析处理,实现起来也很容易.测试结果表明,该方法达到了满意效果. 相似文献
9.
10.
指代消解是自然语言处理技术的核心问题,该文结合维吾尔语语义特征,提出基于深度学习的维吾尔语人称代词指代消解方法。通过堆叠多层无监督RBM网络和一层有监督BP网络,构建DBN深度神经网络学习模型,RBM网络保证特征向量映射达到最优,BP网络对RBM网络的输出向量进行分类,实现维吾尔语人称代词指代消解。经过维吾尔语指代消解语料库测试, F值达到83.81%,比SVM方法高出2.88%。实验结果表明,同等条件下,该方法能有效提升维吾尔语人称代词消解的精度,有助于维吾尔语指代消解研究。 相似文献
11.
12.
13.
随着网络资源的快速膨胀,海量的文本自动处理任务面临着巨大的挑战,而文本主题抽取就是文本自动处理领域中的一项重要研究课题.针对词语量化关系的主题概念抽取算法,首先在词聚类的基础上建立概念向量空间模型,由知网中词语相似度,加权计算出概念权重;然后利用词典中词语之间量化关系,通过对概念的相关向量和权重的向量乘积得到每个概念的主题重要度;最后依据重要度抽取出反映文本主题的概念来.实验证明,上述与传统的词频统计相比,准确率更高. 相似文献
14.
基于属性的概念格渐进式生成算法 总被引:18,自引:0,他引:18
提出了一种新的基于属性的渐进式概念格生成算法 ,通过不断地渐增属性来构造概念格 .该算法不仅为概念格的构造提供了一种新的方法 ,还解决了在已构造好概念格的前提下 ,增加属性所带来的概念格更新问题 .给出了算法的实现方法 ,并结合实例说明了概念格的更新过程 .试验表明 ,在通常情况下 ,基于属性的渐进式概念格生成算法的性能往往更优越 相似文献
15.
无线资源管理对实现资源的有效利用起着至关重要的作用.针对变电站中无线网络资源分配问题,提出了基于非合作博弈的变电站无线网络资源的优化管理算法,解决了全双工系统的无线电资源分配问题.将下行链路与上行链路的联合速率最大化问题建模成为上下行链路信道之间的非合作博弈,提出了基于非合作博弈的迭代算法.该算法有效的实现最佳上行链路与下行链路的资源分配,直到达到纳什均衡.仿真结果表明,该算法实现了快速收敛,与同等资源分配方法相比,可以显著提高全双工的性能. 相似文献
16.
对形式背景上的G偏序集、M偏序集和GM偏序集的偏序关系作了进一步讨论,提出了对象上邻、对象下邻、属性上邻、属性下邻、对象上界、对象下界、属性上界、属性下界和极大对象下界等概念,并根据上下邻之间的关系给出G偏序图、M偏序图和GM偏序图的构建算法,最后给出了不需要建格而可直接在GM偏序图上进行规则提取的算法,并通过实例验证了算法的有效性。 相似文献
17.
概念格是进行数据分析的有力工具,模糊集是数据处理的有效方法之一,模糊概念格有重要的理论与应用价值,但它的结构与性质依赖于蕴涵算子的选择,基于此,介绍了基于下半连续三角模生成的剩余蕴涵以及模糊概念格的算子和定义,提出了基于不同蕴涵算子的模糊概念格的实现算法,分析了算法的复杂度等性能,最后通过实例说明了基于Godel 蕴涵和Lukasiewicz 蕴涵的模糊概念格的建格方法。 相似文献
18.