首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 156 毫秒
1.
一种基于多层语义相似性度量的图像检索方法   总被引:3,自引:0,他引:3  
图像通常用关键词表示其语义信息,基于关键词的图像检索方式存在因用户理解差异而导致对图像语义理解的歧义问题。文中利用语言学本体WordNet中单词的语义层次,并综合考虑单词之间的同义关系、上下位关系等不同层次的抽象语义信息,通过建立检索词和标注词间的语义关联,统一不同用户对图像语义的理解和描述,再结合单词在不同抽象层次的语义信息计算图像的相似性距离,实现了基于高层语义的图像检索。实验结果表明,上述方法能有效提高图像的检索性能。  相似文献   

2.
目前,基于语义的Web挖掘使语义Web和Web挖掘两个领域结合起来,并在一定程度上促进了各自的发展。本文介绍了语义Web的体系结构和Web挖掘以及智能Agent的相关概念,并提出了在多Agent框架下构建基于语义的Web挖掘信息智能获取系统模型,经过分析说明此模型在一定程度上提高了信息获取的智能化水平。  相似文献   

3.
针对现有领域情感词典在情感和语义表达等方面的不足,提出一种基于词向量的领域情感词典构建方法。利用25万篇新闻语料和10万余条酒店评论数据,训练得到word2vec模型;选择80个情感明显、内容丰富、词性多样化的情感词作为种子词集;利用TF-IDF值在词汇重要程度的度量作用,在酒店评论中获得9 860个领域候选情感词汇;通过计算候选情感词与种子词的词向量之间的语义相似度,将情感词映射到高维向量空间,实现了情感词的特征向量表示(Senti2vec)。将Senti2vec应用于情感词极性分类和文本情感分析任务中,试验结果表明,Senti2vec能实现情感词的语义表示和情感表示;基于特定领域语料的语义相似计算,使得提取的情感特征更具有领域特性,同时不受候选情感词集范围的约束。  相似文献   

4.
基于图理论的概念间语义度量方法,改进了语义相似度部分影响因素,提出一种结合设计良好的领域本体来计算自然语言概念间的语义相似度的算法.对自然语言与本体的关系进行分析,并通过本体对节点密度、节点深度与节点层次顺序等影响概念语义相似度的因素进行了改进,综合考虑概念的语义距离、概念间关系、概念的属性与概念所处的层次等影响因素,利用本体对相关领域的基本术语和关系的准确定义,改进了基于本体的概念间语义相似度的算法.实验结果表明,该算法对于提高概念间相似度的计算精度明显高于其他算法.  相似文献   

5.
针对以往大多数方面级情感分析研究中方面词与上下文交互信息缺失,无法充分利用语义信息等问题,提出一种基于自注意力与图卷积网络结合的方面级情感分析模型。为了提高模型的语义表示能力,一方面利用多头自注意力机制,获取文本长距离依赖关系,与依存关系类型矩阵结合,计算融合位置信息和关系类型信息的权重矩阵,输入图卷积网络获取文本特征表示;另一方面设计了文本-方面注意力层,增强方面与上下文的交互,输入图卷积网络获取方面特征表示;最后连接2个向量,完成情感分析任务。在2个开放数据集中,所提模型的整体性能优于其他对比模型。  相似文献   

6.
基于潜在语义分析的文档检索设计方法   总被引:1,自引:0,他引:1  
文档检索系统围绕如何基于语义层面进行检索来展开研究.基于关键词匹配的检索系统不能处理多词一义的情况,针对此问题设计了基于潜在语义分析的文档检索系统.首先改进了文档一词矩阵单元值的计算过程,调整了传统高频词与低频词在权重上的线性关系,利用Sigmiod函数对权重做平滑处理,使其更符合文档中词的权重;其次利用潜在语义分析结合多维尺度分析算法,优化计算文档在语义间的距离.实验结果显示,能有效在语义上聚类文档,完成查询语句与文档集之间的相似度检索计算.  相似文献   

7.
针对开放文本中中文实体关系抽取的一词多义问题,提出一种基于实体消歧的中文实体关系抽取方法。首先,从知网中挖掘出具有潜在语义关系的实体对,并利用贝叶斯分类的语义消歧方法实现从知网到维基百科的实体映射,以获取高质量的关系实例;然后,根据这些关系实例抽取出其对应文本中共现的句子实例,构建基本的抽取模式;最后通过模式合并的方法生成新模式,再使用新模式来抽取新实例。实验结果表明,该方法与没有进行语义消歧和模式合并的方法相比准确率有所提高。  相似文献   

8.
提出一种利用百度百科半结构化数据自动获取词语相似度的方法,该方法将百科词条与其相关词条看做有向图的两个节点,且两节点相互之间存在着链接关系,然后利用SimRank算法计算百科词条语义相似度。实验表明,该方法优于传统的词语语义相似度测量,能准确地反映词语之间的语义关系。  相似文献   

9.
提出了一种基于语义网络结构的词义消歧方法。将文本片段中出现词的所有词义都看作节点,将两个词的任意两个词义之间的语义关系看作弧,将语义关系的紧密程度看作弧的权重,从而构成一个无向赋权网络;将Google的网页分级(PageRank)算法应用到无向赋权图中,评价网络中节点的重要性,并结合共指词义和词义的常用程度,对文本中出现的名词进行消歧。实验证明了该方法对文本进行词义消歧是有效的。  相似文献   

10.
提出了一种基于语义网络结构的词义消歧方法。将文本片段中出现词的所有词义都看作节点,将两个词的任意两个词义之间的语义关系看作弧,将语义关系的紧密程度看作弧的权重,从而构成一个无向赋权网络;将Google的网页分级(PageRank)算法应用到无向赋权图中,评价网络中节点的重要性,并结合共指词义和词义的常用程度,对文本中出现的名词进行消歧。实验证明了该方法对文本进行词义消歧是有效的。  相似文献   

11.
针对自然语言处理中的中文命名实体消歧问题,提出一种基于异构知识库的层次聚类方法。利用中文信息抽取系统对中文维基百科等知识库进行抽取,形成包含人物信息、实体关系的实体信息对象,并在Hadoop平台上用分布式计算进行层次聚类,研究人物实体特征的选取和维基百科等知识库的使用对命名实体消歧结果的影响。结果表明加入百科知识库后,F值从91.33%增加到了92.68%。  相似文献   

12.
Text representation based on word frequency statistics is often unsatisfactory because it ignores the semantic relationships between words, and considers them as independent features. In this paper, a new Chinese text semantic representation model is proposed by considering contextual semantic and background information on the words in the text. The method captures the semantic relationships between words using Wikipedia as a knowledge base. Words with strong semantic relationships are combined into a word-package as indicated by a graph node, which is weighted with the sum of the number and frequency of the words it contains. The contextual relationship between words in different word-packages is stated by a directed edge, which is weighted with the maximum weight of its adjacent nodes. The model retains the contextual information on each word with a large extent. Meanwhile, the semantic meaning between words is strengthened. Experimental results of Chinese text classification show that the proposed model can express the content of a text accurately and improve the performance of text classification. Compared to Support Vector Machines, Text Semantic Graph-based Classification can improve the efficiency by 7.8%, reduce the error rate by 1/3, and show more stability.  相似文献   

13.
针对Web2.0社会化标签系统中标签组织混乱和标签语义模糊的问题,围绕标签共现网络的拓扑图,建立了一种形式化的标签语义相关度计算模型.该模型利用基于统计的标签语义相关度计算结果,为标签共现网络的拓扑图扩展以语义相关度权值,并定义算子围绕标签共现网络的拓扑图来计算权值的综合效应,从而可以显式地描述标签语义关联的交叉影响,并在标签语义相关度的计算中融入这些影响因素.从照片共享网站Flickr中抓取热门标签数据,通过实验对该模型的计算过程、计算结果的有效性和实用性等进行了分析评价.实验表明,该模型的标签语义相关度计算结果更为准确,可以更好地引导和约束Web2.0用户的标签使用行为.  相似文献   

14.
克服当前文本分类法中基于词形匹配带来的局限性,基于WordNet语义词典和隐含语义索引(LSI)模型,提出了基于语义集索引的英文文本分类方法. 该方法在分类初期首先利用WordNet构建语义词典库,利用单词的语义集代替单词作为文本特征向量的特征项;然后利用LSI模型进一步深入挖掘语义集概念间的深层联系,将语言知识和概念索引有效地融合到文本向量空间的表示中. 针对Naive Bayes及简单向量距离文本分类法的实验结果显示,2种文本分类法的分类准确率均随着语义分析的深入逐步提高,充分表明了语义挖掘对文本分类的重要性和必要性。  相似文献   

15.
提出了一种基于句法模式的语义关系抽取方法,用于从术语词典中抽取语义关系.该方法以句法模式为中心,结合了自然语言处理技术和统计的思想,充分利用术语词典文档中的句法信息,通过抽取包含着语义关系信息的句法模式,并将其与词典文本进行近似匹配以达到抽取语义关系的目的.实验结果表明,该方法可以有效地从术语词典中抽取多种语义关系.  相似文献   

16.
To improve motion graph based motion synthesis,semantic control was introduced.Hybrid motion features including both numerical and user-defined semantic relational features were extracted to encode the characteristic aspects contained in the character's poses of the given motion sequences.Motion templates were then automatically derived from the training motions for capturing the spatio-temporal characteristics of an entire given class of semantically related motions.The data streams of motion documents wer...  相似文献   

17.
To avoid the scalability of the existing systems that employed centralized indexing,index flooding or query flooding,we proposed an efficient peer-to-peer information retrieval system SPIRS (Semantic P2P-based Information Retrieval System) that supported state-of-the-art content and semantic searches. SPIRS distributes document indices through P2P network hierarchically by Latent Semantic Indexing (LSI) and organizes nodes into a hierarchical overlay through CAN and TRIE. Comparing with other P2P search techniques,those based on simple keyword matching,SPIRS has better accuracy for considering the advanced relevance among documents. Given a query,only a small number of nodes are needed for SPIRS to identify the matching documents. Furthermore,both theoretical analysis and experimental results show that SPIRS possesses higher accuracy and less logic hops.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号