共查询到20条相似文献,搜索用时 62 毫秒
1.
提出将概念图引入查询扩展,从概念的层面上进行语义的扩展。使用概念图表示查询可以更准确地表明用户的查询意图,并在此基础上进行语义的扩展,通过这种方法给出的扩展查询更符合用户的查询意图。对用户查询进行基于概念图的查询扩展,并将结果与百度的相似查询进行了比较,证明基于概念图的查询扩展能更准确地把握用户的查询意图。 相似文献
2.
针对传统基于义原同现频率的汉语词义排歧算法的“盲目性”,提出一种“双距离”词义排歧算法,即在计算待排歧词各义项与特征词之间的相关系数时,考虑两个距离因素:特征词与待排歧词之间的空间距离;最近选择该义项的同形歧词与该待排歧词之间的空间距离。实验表明,改进的算法是有效的。 相似文献
3.
4.
本文使用概念图为数据库的推理问题建立了相关的解决模型,给出了推理相关的知识 表示及推理过程的描述,建立了相关的推理控制系统。 相似文献
5.
本文提出了一种基于词和词义混合的统计语言模型,研究了这个模型在词义标注和汉语普通话语音识别中的性能,并且与传统的词义模型和基于词的语言模型进行了对比。这个模型比传统词义模型更准确地描述了词义和词的关系,在词义标注中具有较小的混淆度;在汉语普通话连续音识别中,这个词义模型的性能优于基于词的三元文法模型,并且需要较小的存储空间。 相似文献
6.
查询扩展是信息检索技术研究的一个重要组成部分。目前的查询扩展是基于统一的用户模型,没有考虑到用户的个人兴趣,这对查询扩展的精确度造成了一定的影响。分析了产生这种问题的原因,提出了基于概念图的用户兴趣扩展模型,通过该模型来有效提高查询扩展的精确度。实验显示,该方法能有效提高查询的查全率和查准率。 相似文献
7.
一种基于词义向量模型的词语语义相似度算法 总被引:1,自引:0,他引:1
针对基于词向量的词语语义相似度计算方法在多义词、非邻域词和同义词三类情况计算准确性差的问题, 提出了一种基于词义向量模型的词语语义相似度算法.与现有词向量模型不同, 在词义向量模型中多义词按不同词义被分成多个单义词, 每个向量分别与词语的一个词义唯一对应.我们首先借助同义词词林中先验的词义分类信息, 对语料库中不同上下文的多义词进行词义消歧; 然后基于词义消歧后的文本训练词义向量模型, 实现了现有词向量模型无法完成的精确词义表达; 最后对两个比较词进行词义分解和同义词扩展, 并基于词义向量模型和同义词词林综合计算词语之间的语义相似度.实验结果表明本文算法能够显著提升以上三类情况的语义相似度计算精度. 相似文献
8.
一种新的基于交叉性Web日志的事务识别算法 总被引:1,自引:0,他引:1
该文提出一种新的Web使用记录挖掘过程中的事务识别算法。该算法提出的背景是在采用基于最大向前引用和频繁遍历路径的方法进行Web用户访问模式挖掘时,通过对实验结果数据、源日志文件、用户使用互联网的特点以及互联网本身的局限进行了详细地分析和考察,发现了交叉性日志的存在。源数据新特性的出现,使得原算法在性能上有了明显的下降,因此,提出了新的基于有向图深度优先遍历的算法思想。该文设计了有针对性的模拟实验,实验结果无论从冗余事务的减少量或者事务的平均长度上都证明了新算法的优越性。 相似文献
9.
一种从线性概念图中自动抽取本体概念的算法 总被引:1,自引:0,他引:1
马峻 《计算机工程与应用》2004,40(23):161-164
企业信息集成必须面对大量的遗留系统(Legacy),而获取遗留系统的本体是实现集成遗留系统的关键。依据本体是更抽象概念的论断,建立了关系数据表到线性概念图的映射关系,利用线性概念图这一中介,设计了从线性概念图自动抽取本体的算法,并通过文中的实例加以验证算法的有效性以及复杂性。 相似文献
10.
相对于指纹识别等传统生物特征识别手段,手指静脉识别是一种新兴的具有较好应用前景的生物特征识别技术。本文设计了具有自适应光源系统的手指静脉采集仪,能够自动获得亮度均匀的手指静脉图像;提出了一种基于模板匹配的手指静脉识别算法,采用基于多方向灰度谷底搜寻方法提取手指静脉特征,然后将从同一手指多个图像中提取的静脉特征合成模板,并通过门限阈值消除模板中的随机差异信息。实验结果表明,运用本研究提出的基于模板匹配的手指静脉识别算法能有效提高识别准确性,具有99.10%的识别准确率和1.03%的等错误率。 相似文献
11.
传统的基于知识库的词义消歧方法,以一定窗口大小下的词语作为背景,对歧义词词义进行推断.该窗口大小下的所有词语无论距离远近,都对歧义词的词义具有相同的影响,使词义消歧效果不佳.针对此问题,提出了一种基于词语距离的网络图词义消歧模型.该模型在传统的网络图词义消歧模型的基础上,充分考虑了词语距离对消歧效果的影响.通过模型重构、优化改进、参数估计以及评测比较,论证了该模型的特点:距离歧义词较近的词语,会对其词义有较强的推荐作用;而距离较远的词,会对其词义有较弱的推荐作用.实验结果表明,该模型可以有效提高中文词义消歧性能,与SemEval-2007:task#5最好的成绩相比,该方法在MacroAve(macro-average accuracy)上提高了3.1%. 相似文献
12.
从神经网络的基本原理和自动词义排歧的技术入手,阐明应用神经网络技术进行汉语词义排歧研究的基本方法和步骤,并给出了实验结果和分析。 相似文献
13.
14.
基于领域知识的图模型词义消歧方法 总被引:1,自引:0,他引:1
对领域知识挖掘利用的充分与否,直接影响到面向特定领域的词义消歧(Word sense disambiguation, WSD)的性能.本文提出一种基于领域知识的图模型词义消歧方法,该方法充分挖掘领域知识,为目标领域收集文本领域关联词作为文本领域知识,为目标歧义词的各个词义获取词义领域标注作为词义领域知识;利用文本领域关联词和句子上下文词构建消歧图,并根据词义领域知识对消歧图进行调整;使用改进的图评分方法对消歧图的各个词义结点的重要度进行评分,选择正确的词义.该方法能有效地将领域知识整合到图模型中,在Koeling数据集上,取得了同类研究的最佳消歧效果.本文亦对多种图模型评分方法做了改进,进行了详细的对比实验研究. 相似文献
15.
16.
词义消歧是自然语言处理中的一个关键问题,为提高大规模词义消歧的准确率,提出了一种基于模板的无导词义消歧方法。利用多义词不同义项的同义或近义单义词对该义项进行表述,综合考虑共现词出现的位置、上下文距离及出现频次,据此构造语境模板,有效地解决了多义词义项确定的困难。实验结果表明,本文提出的方法在消歧性能方面有较明显的改善。 相似文献
17.
针对自然语言处理领域词义消歧这一难点,提出一种新的汉语词义消歧方法。该方法以《知网》为语义资源,充分利用词语之间的优先组合关系。根据优先组合库得到句中各个实词与歧义词之间的优先组合关系;将各实词按照优先组合关系大小进行排列;计算各实词概念与歧义词概念之间的相似度,以判断歧义词词义。实验结果表明该方法对于高频多义词消歧是有效的,可作为进一步结构消歧的基础。 相似文献
18.
一种新的汉语词义消歧方法 总被引:2,自引:0,他引:2
针对自然语言处理领域词义消歧这一难点,提出一种新的汉语词义消歧方法。该方法以《知网》为语义资源,充分利用词语之间的优先组合关系。根据优先组合库得到句中各个实词与歧义词之间的优先组合关系;将各实词按照优先组合关系大小进行排列;计算各实词概念与歧义词概念之间的相似度,以判断歧义词词义。实验结果表明该方法对于高频多义词消歧是有效的,可作为进一步结构消歧的基础。 相似文献
19.
离合词词义消歧要解决如何让计算机理解离合词中的歧义词在具体上下文中的含义。针对离合词中歧义词在机器翻译中造成的对照翻译不准确以及在信息检索中无法匹配有效信息等问题,将词义消歧的方法应用于离合词中的歧义词,采用SVM模型建立分类器。为了提高离合词词义消歧的正确率,在提取特征时,结合离合词的特点,不仅提取了歧义词上下文中的局部词、局部词性、局部词及词性3类特征,还提取了“离”形式的歧义词的中间插入部分的特征;将文本特征转换为特征向量时,对布尔权重法进行了改进,依次固定某种类型特征权重,分别改变另外两种类型特征权重的消歧正确率来验证3类特征的消歧效果。实验结果表明,局部词特征、局部词及词性特征对消歧效果的影响高于局部词性特征,且采用不同类型的特征权重与采用相同的权重相比,消歧正确率提高了1.03%~5.69%。 相似文献