首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 46 毫秒
1.
一种基于语义关联的查询优化方法   总被引:7,自引:2,他引:5  
提出了一种综合词法关系和语义分析的查询优化方法。通过对查询关键字词法特性和本体实例之间语义关联强弱的分析,提高了查询关键字到本体概念映射的完整性和准确率,帮助搜索引擎对用户的意图做出有效推测,解决了传统搜索引擎不能很好理解用户意图的问题。设计实现了相应的查询优化系统,实验表明该系统可以有效提高搜索的准确率。  相似文献   

2.
针对目前Deep Web分类研究中所采用的Post-query查寻探测方法缺乏语义支持的问题,提出一个基于本体的语义查询探测分类方法。主要思想如下:首先针对一个Deep Web数据库集合,提取查询接口中的属性及其实例,半自动建立领域本体,并且通过领域本体来表示类别特征;然后利用领域本体中的概念以及相应的实例构造语义查询集;最后对待分类的Deep Web数据库利用语义查询集进行查询探测,计算查询探测返回的结果文档在领域本体中的信息覆盖量,并以此对Deep Web进行分类。实验表明:这种语义查询探测分类的方法和以往的方法相比,在准确率、查全率和F1值上有一定的提高。  相似文献   

3.
用于分布式语义查询的语义逼近方法   总被引:2,自引:0,他引:2  
传统的基于关键词的信息查询方法已经不能满足用户的需要. 为此,提出基于语义逼近的信
息查询方法,探讨了语义替换规则和基于逼近度的查询结果排序策略. 最后基于多代理技术
实现了一个分布式语义查询系统,能执行跨多个本体的语义查询任务.   相似文献   

4.
5.
提出了一种基于句法模式的语义关系抽取方法,用于从术语词典中抽取语义关系.该方法以句法模式为中心,结合了自然语言处理技术和统计的思想,充分利用术语词典文档中的句法信息,通过抽取包含着语义关系信息的句法模式,并将其与词典文本进行近似匹配以达到抽取语义关系的目的.实验结果表明,该方法可以有效地从术语词典中抽取多种语义关系.  相似文献   

6.
许多中国画作品的图像被数字化后在因特网上展出,如何有效的识别它们并进行分类是一个值得研究的问题.提出一种基于内容的中国画识别与分类方法,通过颜色和纹理特征来表现中国画图像的可视内容.结果显示该方法能够有效的识别和分类中国画图像,其中支持向量机的分类算法可以取得最佳的分类效果.  相似文献   

7.
基于Ontology的语义查询分析研究   总被引:1,自引:0,他引:1  
目前的搜索引擎普遍存在着查全率和查准率不高的问题,任何一个简单的查询都可能返回数以万计的检索结果,而其中只有很少一部分与用户真正的检索要求有关,对查询的处理是基于本体(Ontology)的语义检索最重要的部分.针对现有查询分析方法的不足,提出了一种基于Ontology的综合词义关系和语义关联分析的查询分析算法,给出了基于本体映射的语义相似度算法,通过对用户输入关键字词义特性和本体实例之间语义关联强弱的分析,提高了用户输入关键字到本体概念映射的完整性和准确率,保证了用户查询和检索语言在语义上的一致性,提升了查询的满意度.  相似文献   

8.
基于内容的图像检索技术克服了文本检索方式主观片面的缺陷,客观地描述了图像的本质特征,然而却丢掉了文本方式下对图像的语义描述,导致检索准确率降低.借鉴数据挖掘技术中的图像分类方法,提出了结合视觉特征与图像语义描述以提高检索系统性能的思想,主要进行了图像显著特征选择、图像分类算法特征约简以及检索系统优化设计3方面工作,以提高检索系统的人机界面和交互性能.  相似文献   

9.
为解决建筑师难以快速地从互联网中检索到符合创作需求的建筑图像的问题,提出了应用Web标注技术的建筑图像语义采集方法.首先,从建筑学角度界定了建筑图像及建筑图像语义的概念和类型;其次,给出了该方法的总体框架和操作流程;最后,以著名建筑网站为例进行案例演示,验证了该方法的可行性和有效性.操作流程细分为3个步骤,以人工添加和在线学习的方式建立建筑语义词典;运用数据采集软件,从建筑图像所在网页中分别采集图像名称、图像注释、图像周围文本、所在网页标题、所在网页正文、图像超链接网页标题6项图像相关文本;根据图像语义提取规则,从上述文本中提取建筑图像语义,与图像文件建立关联后存储到建筑图像数据库.案例检验结果表明,该方法是可行的,具有较强的操作性,能够自动、批量地从互联网中下载建筑图像,并采集图像名称、图像类别、图像主题、项目名称、项目类型等30多项特征,有效地克服了建筑图像查询效率较低的问题,进而提升了建筑师运用互联网图像进行创作的能力.  相似文献   

10.
该文分析和量化了影响本体语义相似度的各种因素,并提出了一种基于距离的概念语义相似度计算模型。在此基础上,通过对相似度阈值的控制来调整扩展概念集的范围和大小,从而实现语义概念层次上的查询扩展。经过实验分析,验证了该方法的合理性及可行性。  相似文献   

11.
针对基于关系数据库的遗留系统能否集成到语义层这一问题,研究关系查询到语义查询转换的完备性.分析一种从关系数据库获取本体的自动学习方法,抽取数据库表、属性同本体类、属性之间映射函数.基于这些函数,得出关系对应的基本简单协议和RDF查询语言(SPARQL)代数表达式.逐一用SPARQL代数来模拟5种基本关系代数运算:选择、投影、并、差和笛卡尔积,并给出其相应的转换算法.结果表明:在这种本体学习的方法下SPARQL代数可以表达5种基本关系代数,以及由它们组合而成的关系表达式,因此,SPARQL是关系完备的,并支持那些基于关系查询的遗留系统向语义层的移植.  相似文献   

12.
主题搜索ROBOT综合爬行策略的研究   总被引:6,自引:0,他引:6  
在分析、评价常用主题搜索ROBOT爬行策略的基础上,将三重过滤技术与改进的Shark启发式搜索算法相结合,设计了自动主题搜索引擎ROBOT的综合爬行策略。由于综合爬行策略在爬行中兼顾了网页的相关性、主题精度和网页质量,因此应用综合爬行策略在Web上下载主题相关网页时,既可利用链接分析扩大某个主题的资源覆盖度,又可保证搜索结果与主题高度相关。  相似文献   

13.
Text representation based on word frequency statistics is often unsatisfactory because it ignores the semantic relationships between words, and considers them as independent features. In this paper, a new Chinese text semantic representation model is proposed by considering contextual semantic and background information on the words in the text. The method captures the semantic relationships between words using Wikipedia as a knowledge base. Words with strong semantic relationships are combined into a word-package as indicated by a graph node, which is weighted with the sum of the number and frequency of the words it contains. The contextual relationship between words in different word-packages is stated by a directed edge, which is weighted with the maximum weight of its adjacent nodes. The model retains the contextual information on each word with a large extent. Meanwhile, the semantic meaning between words is strengthened. Experimental results of Chinese text classification show that the proposed model can express the content of a text accurately and improve the performance of text classification. Compared to Support Vector Machines, Text Semantic Graph-based Classification can improve the efficiency by 7.8%, reduce the error rate by 1/3, and show more stability.  相似文献   

14.
如何使用图像底层特征有效表达高层语义是实现图像自动分类难以逾越的鸿沟。本文将模糊粗糙集理论引入图像自动分类,在使用图像底层特征表达高层语义的图像自动分类过程中,把高维特征向量处理、合适的描述符集合选择难题转换为模糊决策表,使用图像语义贴近度概念来检验图像特征属性间的数据依赖关系,以达到属性约简,剔除冗余信息和图像分类规则推导的目的,并定义了图像类别隶属度函数对图像进行分类。实验结果表明该图像分类系统的分类正确率达81.7%,说明该方法具有很好的精确性和有效性,能较好地实现图像自动分类。  相似文献   

15.

为了有效获取短文本评论隐含的语义信息进行情感倾向性识别,提出一种基于CNN-LSTM模型的短文本情感分类方法.利用卷积神经网络(convolutional neural network,CNN)模型设置不同大小的卷积窗口,提取短文本的语义特征.引入长短时记忆(long short-term memory,LSTM)神经网络模型对短文本的情感倾向进行预测.在3种不同的中英文短文本评论数据集上进行验证取得较好的性能,其中,在NLPCC评测数据集上,正、负向情感识别的F1值分别达到0.768 3和0.772 4(优于NLPCC评测的最优结果).相较于传统的机器学习分类模型,t-test检验结果表明性能提升显著.

  相似文献   

16.
应用未确知集合理论建立了一种对搜索引擎性能进行综合评价的数学模型,综合应用AHP法和熵值法给出了搜索引擎性能评价指标的分类权重,并通过实例分析表明了本方法的合理性和有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号