首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 250 毫秒
1.
针对各检索词在整个查询中的权重不同和由检索词组合顺序不同而导致的暗含语义差异的问题,利用正排索引和倒排索引的结构特点,在基于倒排索引和向量空间检索模型的基础上加入相应的预处理算法,提出了查询步进和文档步进的概念,并分析了由此对检索带来的影响,给出了与检索词排列顺序相关的全文检索方法.  相似文献   

2.
为了高效的进行商标设计,提出了基于内容的商标检索算法.首先应用Zernike矩描述图像的形状信息,并将手绘图作为查询条件进行检索,依据形状距离进行排序,将排序结果作为第一轮检索结果输出.其次,用户对第一轮检索结果进行标注,并将标注结果反馈给系统,通过分类器学习后,再次进行检索并输出最终检索结果.实验结果表明,提出的算法在商标图像的检索中具有检索准确率高、耗时少的特点;此外,算法可支持用户以手绘的方式进行查询,有一定的实用价值.  相似文献   

3.
在文本检索过程中,排序算法一定程度上影响到搜索引擎的质量。论文首先分析了Lucene组织结构,包括建立索引,检索索引文件以及结果集排序的工作过程和原理,着重剖析了Lucene基于向量模型的排序算法,并在原有排序算法基础上,采用基于关键词加权方式改进了全文检索的排序结果。实验结果证明,改进后的排序算法提高了系统的结果精确度,满足了项目的实际需求。  相似文献   

4.
在文本检索过程中,排序算法一定程度上影响到搜索引擎的质量。论文首先分析了 Lucene 组织结构, 包括建立索引,检索索引文件以及结果集排序的工作过程和原理,着重剖析了Lucene基于向量模型的排序算法, 并在原有排序算法基础上,采用基于关键词加权方式改进了全文检索的排序结果。实验结果证明,改进后的排序 算法提高了系统的结果精确度,满足了项目的实际需求。  相似文献   

5.
数据库模糊查询会产生很多查询结果,因此有必要将查询结果按照用户需求进行排序。首先给出了模糊查询定义,然后根据模糊集理论提出了基于隶属度的模糊查询结果排序方法,该方法综合考虑了查询指定的属性权重和查询结果对模糊查询的隶属度。实验及分析证明,提出的模糊查询结果排序算法能够较好地满足用户需求,具有较高的排序质量。  相似文献   

6.
在CBR推荐系统中,基于受限的信息(不完全信息)进行检索,得到可接受的产品是一个重要的、具有挑战性的问题。文章提出了一种发现推荐规则的方法:最优规则推荐算法用来检索事例库。该方法应用于不完全查询中,在发现的规则数量上与NN方法发现的规则基本相同,但这些规则有较高的事例覆盖率。跟决策树方法相比,该方法发现的规则数量少,更容易解释,而且有较高的事例覆盖率。  相似文献   

7.
针对传统基于关键字匹配的检索方法在地方志数据查询时的不足,给出了基于Solr和本体的地方志数据语义检索解决方案。建立了地方志本体库;提出了基于本体的综合语义相似度进行语义查询扩展的方法;将本体技术与全文检索技术相结合,建立了基于Solr和本体的语义检索模型架构。最后设计实验,对数据库SQL查询方法和文章提出的语义检索方法的查全率、查准率和查询时间进行对比。实验表明,文章提出的方法明显优于基于关键字匹配的数据库SQL查询方法,具有可行性和有效性。  相似文献   

8.
张颖  李昕 《辽宁工学院学报》2013,(5):305-309,312
提出一种新的关键词查询排序算法来提高关系数据库关键词查询系统的查询效果。文中定义了关键词查询模型,分析了典型系统的排序算法,并确定了影响查询效果的四个主要因素,进而提出新的关键词查询排序算法。实验结果表明,该算法具有较高的查询和排序准确率,能够有效地提高关键词查询效果。  相似文献   

9.
对海量的、异构XML文档进行检索时,现有的查询语言如XPath,XQuery已无法胜任,需要将数据挖掘和信息检索两方面相结合进行近似查询.提出一种新的XML文档近似查询方法,首先根据提出的层次路径模型提取文档结构特征,进行向量空间映射.然后通过奇异值分解进行矩阵变换,在去除相关冗余的同时有效地降低了空间维数.目标文档的匹配在变换后的检索空间中进行,同时对返回的查询结果进行相似性排序.采用DBLP数据集进行测试,实验获得良好的查询及排序结果.  相似文献   

10.
为了解决微博检索面临的"用户查询"和"相关文档"都是极端短文本的情况,及由此造成的检索性能欠佳的难题,研究并实现了一种微博检索结果的二次重排算法,基于微博内容相似关系构建关系图模型,利用PageRank算法对微博检索结果进行二次排序.比较了基于余弦相似度、戴斯系数、单向戴斯系数等文本内容相似度计算方法.实验结果表明:二次排序算法能够有效提升微博检索性能,同时图模型迭代性能与相关主题比例存在依存关系.有鉴于此,讨论通过决策树重排算法去除非相关主题对微博排序的影响.  相似文献   

11.
基于Lucene实现了一个海量数据库全文检索的原型。把关系数据库引入了本系统,可针对不同类型的源数据库灵活配置,比采用配置文件更加灵活;采用多线程,通过动态机制来实现不同类型源数据库中记录的抽取、转换、建立索引;提供定时自动更新索引的功能;提供多种检索方式。  相似文献   

12.
全文检索作为现代信息检索技术的一个重要分支,不仅是处理非结构化数据的重要工具,也是搜索引擎的主流技术之一。本文首先从全文搜索引擎模型入手,对其基本工作原理和流程进行深入研究,并结合这些知识研究开源检索引擎包Lucene的架构原理及其开发应用方法。然后介绍中文分词和基本算法及Lucene的相关技术。  相似文献   

13.
由于目前的图像检索技术没有考虑壁画的构图学特征,缺乏对复杂语义的处理能力,难以满足古代壁画研究工作对检索全面性和准确性的要求.为提高古代壁画图像语义检索的质量,提出基于构图分析的相关度模型,通过引入基于绘画构图学的理论和分析方法,从壁画内容的布局、主题和语义三方面用量化方法描述检索语义与壁画内容的相关度,较好地解决了用户的真实检索意图与壁画内容间的“语义鸿沟”问题.该相关度评价模型可嵌入基于语义查询扩展的框架中,以提高Top N结果的准确率,同时维持了较高的查全率.敦煌壁画资料检索的实际应用表明:以反映前n个结果准确率的R-Precision为评测指标,基于构图分析的相关度评价方法可比未采用相关度评价的基线方法平均高出36%.  相似文献   

14.
基于全局运动的视频检索方案   总被引:1,自引:0,他引:1  
提出了一种基于全局运动的视频检索方案.对活动图像专家组(MPEG)视频进行全局运动分析,较精确地提取出摄像机的运动模型,将模型参数构成特征点序列,采用顺序匹配的方法进行示例检索;还根据全局运动参数构造了运动分析函数,对视频进行了准确的全局运动分割和语义注释,并以此为基础,利用可扩展标记语言(XML)描述了视频的全局运动,测试了基于Xquery的语义查询.试验结果表明,在风景类视频中,该方案实现了一定程度的语义检索,较同类检索方案查询效率得到了提高.  相似文献   

15.
提出基于数据仓库多维模型维度及维度属性特征的联机分析处理(OLAP)关键词查询方法,将获得广泛应用的关键词查询方法和OLAP结合,可大大降低OLAP应用的门槛.该方法用列结构创建数据仓库维度全文索引,根据用户输入的查询获得按关键词划分的命中集,对命中集进行连接并排序后将产生的候选结果提供给用户.该方法基于对数据仓库用户更加关注概要性数据的特性,以及多维模型维度及其属性的非均衡型特征的分析,采用过滤不相关维度属性及重复维度列值的方法,并在传统的全文检索排序算法上增加维度层次权重系数.在MS SQL Server提供的FoodMart和AdventureWorks示例数据集上的实验对上述因素的影响做出了比较和分析,结果表明,首选候选结果命中率均优于基于关键词的分析处理方法.  相似文献   

16.
论文对全文文献检索系统加以探讨,重点讨论检索的方法和技术的实现。分析导出系统的一般结构,给出有关库(文件)的信息组织形式,提出一种全文文献检索处理方法并导出检索处理流程。同时对工作区管理提出一种动态管理策略。  相似文献   

17.
如何设计有效的相关性排序函数是信息检索研究的一个核心问题,因为排序函数直接影响着搜索结果的质量。排序函数的好坏一般由信息检索评价方法进行评估,对其进行优化的主要困难是这些方法都依赖于结果文档的排序位置,因此对于查询的结果返回列表中相关文档的位置的研究是十分重要的。通过探索相关文档和不相关文档之间的偏序关系构造新的输入样本;该样本是由一个相关文档和一组不相关文档所构成的,它能够更加有效的区分文档的相关性;基于该输入样本,通过定义位置损失函数对排序结果进行优化。在公开数据集Letor30的上的实验结果显示该方法可以将多种排序评价方法的准确率平均提高2%,证明了所提出的方法的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号