共查询到17条相似文献,搜索用时 171 毫秒
1.
目前基于How Net的词语语义相似度计算多是根据上下位关系计算语义距离的方法,其结果与人的主观认识存在差异。提出了一种词语语义相似度计算的改进方法,在原有方法基础上,同时考虑影响词语相似度的多种因素,如How Net中义原的深度和密度等,进而挖掘义原间关系,改进原有计算方法。实验结果表明,利用所提出的改进方法计算的词语语义相似度更加贴合人的主观认识。 相似文献
2.
文本相似度计算在专利信息分析系统中有着广泛的应用前景.传统的基于向量空间模型的文本相似度计算方法,一方面未能很好地考虑上下文信息对词语语义的约束,导致不能对不同语境中词语的语义进行有效区分;另一方面使用词典作为计算相似度的依据具有领域相关性,在特定领域未能给出有效的语义理解.提出一种使用领域本体作为文本相似度计算基础的方法,该方法中使用语义消歧来解决上下文对于词语语义的影响;使用领域本体概念意义相同关系来计算文本相似度.实验结果显示本方法的准确度相对于现有典型的相似度计算方法有所提高. 相似文献
3.
该文面向本体关系集合的自动构建,提出一种基于百科词条的本体概念聚类方法,用于发现领域概念之间的语义关系。在给定领域本体概念集合的条件下,该方法首先获取相关的百科词条并建立每一概念的向量模型,然后根据距离判别法进行概念聚类,得到概念间的相近关系。采用该方法对3个领域中的领域概念集合进行聚类,实验结果表明,该文方法比传统聚类算法有更好的聚类结果,有助于概念间关系的自动获取和领域本体自动构建。 相似文献
4.
基于同义词词林的词语相似度计算方法 总被引:1,自引:0,他引:1
为解决词语相在语义网自适应学习系统中相似度计算不清的问题,以同义词词林为基础,提出并实现了一种基于同义词词林的词语相似度计算方法,充分分析并利用了同义词词林的编码及结构特点。该算法同时考虑了词语的相似性,和词语的相关性。进行人工测试,替换测试以及与当前流行的基于"知网"的词语相似度算法对比测试的结果表明,该算法与人们思维中的相似度值基本一致,有较高的准确性。 相似文献
5.
为了提高文本聚类的有效性,提出一种基于网络社团结构的文本聚类算法。基于语义知识库理论,利用文本集与词语间的关系,引入文本相似度概念,再结合Newman社团聚类算法特性,将文本集作为独立社团,用文本相似度表示社团联系的紧密程度,对网络文本进行聚类。实验结果表明,该方法有效可行。 相似文献
6.
《湖北工业大学学报》2015,(5)
在对已有方法进行分析的基础上,提出语义与结构相结合计算句子相似度的方法,并系统地介绍了此方法的实现过程。首先对输入的句子进行预处理,得到词语序列,使用基于知网的方法得到词语间的语义相似度;然后使用词形和句长特征表示句子的结构相似度;最后加权得到两个句子的相似度。实例证明,提出的方法计算得到的句子相似度取得了较好的效果。 相似文献
7.
基于图理论的概念间语义度量方法,改进了语义相似度部分影响因素,提出一种结合设计良好的领域本体来计算自然语言概念间的语义相似度的算法.对自然语言与本体的关系进行分析,并通过本体对节点密度、节点深度与节点层次顺序等影响概念语义相似度的因素进行了改进,综合考虑概念的语义距离、概念间关系、概念的属性与概念所处的层次等影响因素,利用本体对相关领域的基本术语和关系的准确定义,改进了基于本体的概念间语义相似度的算法.实验结果表明,该算法对于提高概念间相似度的计算精度明显高于其他算法. 相似文献
8.
9.
10.
张小红 《郑州大学学报(工学版)》2011,32(5)
将语义相似度计算模型定义为域、概念、属性组成的三维空间模型,并结合领域本体集,从概念格理论的角度考虑了该模型对语义相似度计算的影响.该模型通过对不同的向量加不同的权值来调节其对语义相似度计算的贡献,使计算结果达到最优,从而提高语义相似度计算的准确度.实验结果表明,与单方面计算相似度的方法相比,该方法能有效地提高语义相似度计算的查全率和查准率. 相似文献
11.
PageRank模型在中文情感词极性判别中的应用 总被引:1,自引:1,他引:0
针对倾向性分析任务重的基础性工作——情感词的极性判断工作,提供了一种基于PageTank模型的情感词极性判断方法.由待判别情感词和少量中子情感词构成图中的节点,利用知网(HowNet)语义资源计算词语间的语义想死度,进而得到图中节点间边的权重.通过PageRank模型的引入,综合利用有标种子情感词和无标待判别情感词实现对无标情感词的极性判别.与传统的基于HowNet的情感词判别方法相比,PageRank模型的引入使情感词判别的准确率平均提高10%左右,充分验证了所提方法的可行性. 相似文献
12.
改进的语义相似度计算模型及应用 总被引:3,自引:0,他引:3
在语义检索中,语义相似度计算模型对信息查全率和查准率至关重要,通过改进传统语义相似度计算模型的不足,提出了新的语义相似度计算模型PHSS,它综合考虑概念的属性约束和层次结构,较之传统模型更能精确描述概念间语义距离。在此基础上,构建了一个玉米病虫害防治语义检索系统CDPPIRS,能依据查询信息和知识库进行语义推理,可针对用户多种查询方式提供给用户全面准确的文献信息,满足不同层次农业工作者的查询需求。在CD-PPIRS中的测试结果表明,PHSS在查全率和查准率方面均优于传统模型。 相似文献
13.
WordNet中的综合概念语义相似度计算方法 总被引:1,自引:0,他引:1
作为语义异构问题的基础,概念间语义相似度计算已成为研究热点,对此,提出一种基于WordNet的综合概念语义相似度计算方法. 该方法不仅集成了传统的基于语义距离的算法和基于信息内容的算法,而且引入了深度、密度因子和语义重合度来进行综合分析,并针对综合算法中权值难以确定的问题,引入主成分分析改进权值分配方法. 实验结果表明,改进后的方法计算的相似度与人工判断的相似度相关性较高,有效改善了概念语义相似度计算的准确性. 相似文献
14.
针对文本分类问题,提出新的基于知识增强的图卷积神经网络(KEGCN)分类模型. KEGCN模型在整个文本集上构建了一个包含单词节点、文档节点、外部实体节点的文本图,不同类型节点之间使用不同的相似性计算方法;在文本图构建完成后将其输入到2层图卷积网络中学习节点的表示并进行分类. KEGCN模型引入外部知识进行构图,捕获长距离不连续的全局语义信息,是第1个将知识信息引入图卷积网络进行分类任务的工作. 在4个大规模真实数据集20NG、OHSUMED、R52、R8上进行文本分类实验,结果表明,KEGCN模型的分类准确率优于所有的基线模型. 将知识信息融入图卷积神经网络有利于学习到更精准的文本表示,提高文本分类的准确率. 相似文献
15.
为了在图像显著性区域提取过程中改善算法的自适应性和精准度,提出基于自适应流形相似性的图像显著性区域检测算法。将图像分割成超像素,根据图像中显著性区域频率变化比较大的特性,生成图像显著性区域的高频节点;针对高频节点利用凸包运算寻找显著性区域的种子节点;使用流形算法在图像中对种子节点进行显著性区域信息扩散,得到图像的显著性区域。试验结果表明:利用流形算法搭建求解每个数据的邻接矩阵进行信息扩散,能够在保证信息精准分类的同时提高算法的自适应性,其结果优于同类的图像显著性区域检测算法。 相似文献
16.
赵亚慧 《延边大学学报(自然科学版)》2011,(4):345-348
提出了一种基于潜在语义分析(LSA)的相似文本匹配算法,并将其应用于自动评卷系统中.首先,在充分考虑词项之间相关性的基础上,在低维空间中表示学生答案文本与标准答案文本,然后利用奇异值分解方法模型对其进行了改进;其次,利用LSA技术,以学生答案文本与标准答案文本之间的余弦相似度作为相似性准则,根据相似度值确定该题的得分.实验结果表明,该算法充分考虑了文本语义信息,评分效果较好,是实现基于语义评卷系统的有益探索. 相似文献