首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 140 毫秒
1.
为了提高文本信息检索系统检索性能,针对信息检索系统中普遍使用的向量空间模型(VSM)所固有的缺陷,提出一种新的修正的向量空间模型(MVSM).该模型重新定义了查询索引项的内容,将修饰词与中心词组成的合成短语引入到查询语句及传统的向量空间检索模型的信息表示中,并重新计算作为特征索引项的合成短语的权重值.在此基础上,又对查询索引项使用了基于同义词词典的查询扩展策略.实验结果表明:用合成短语作为查询索引项进行检索,使检索能够在相对精确的范围内进行,提高检索查准率;对查询进行同义扩展,能够使更多的语义相关的文本被检索出来,提高检索查全率.因此,在信息检索系统中应用修正的向量空间模型能够较好地改善检索性能.  相似文献   

2.
为适应动态变化的应用环境,提高索引的综合性能,提出一种自适应的移动对象索引--STBx树.给出了STBx树的索引结构、更新算法和查询算法,并且在性能分析的基础上给出了STBx树进行自适应调节的方法.STBx树以自学习和自适应的运行,在不打断服务的情况下对自身的更新性能和查询性能进行调节,从而达到最佳的平稳的综合性能,以适应更新操作和查询操作的比例以及性能需求动态变化的环境.实验表明:STBx树在动态应用环境下能够实现自适应的调节,并提供优秀的综合性能,优于传统的TPR*树和Bx树.  相似文献   

3.
SQL Server优化技术对提高系统性能至关重要.为充分利用索引,优化袁的查询机制,从而提高SQL Server查询速度,本文从建立有用的索引减少表扫描I/O次数,优化WHERE子句避免列操作,合理应用复合索引选好第一索引列和使用聚集索引使数据在物理上按顺序排列四个方面加以阐述.  相似文献   

4.
从空间索引的基本原理入手,探讨了Oracle 10g Spatial空间索引的实现原理与过程以及如何利用空间索引实现空间查询。实践证明,在Oracle 10g Spatial中,对相同的查询,不同的空间索引得到的查询结果集不一定相同,这就需要选择合适的空间索引方法和方式,提高空间查询的效率和质量,提高Oracle 10g Spatial性能。  相似文献   

5.
在归纳现有密文检索技术的基础上,提出一种针对字符型数据的加密存储与检索方案。采用两阶段查询法,通过构造索引字段存储敏感数据的结构信息,可使第一阶段的模糊查询过滤掉大部分无关记录,从而提高密文查询速率。实验结论显示,所提方案安全可用。  相似文献   

6.
SQL Server的全文搜索功能既可以对纯文本字段进行全文查询,也可以对非结构化的二进制字段进行全文查询,后者在建立索引时使用了筛选器。该数据库提供了一些针对微软自身产品文档的筛选器,对于非微软产品的文档则没有提供,这就涉及到自行编写筛选器的问题。文章就筛选器的编写及其在M icrosoft SQL Server 2005中的应用作了一些探讨。  相似文献   

7.
为了解决传统分布式搜索引擎存在的搜索性能问题,从索引结构、查询算法方面改进了传统模型.提出了一种非集中的高并行化搜索模型,该模型按照文档主题对索引分类,对较长的倒排记录表采用位图结构,利用多线程技术对索引节点实现并行搜索算法(multi max score heap,MMSH).实验结果表明:改进模型中的索引分类方法与倒排表结构的位图策略,能够增强Merge层查询的针对性,降低Merge层节点的CPU和内存开销;在倒排表不能完全存入内存情况下,MMSH算法能够实现高度并行化查询,其查询效率高于经典的term-at-a-time算法,缩短了平均查找时间,提高了系统吞吐量.索引分类、位图结构以及并行查询算法能够避免查询的盲目性,改善了分布式搜索引擎的性能.  相似文献   

8.
针对目前非结构化对等网络搜索算法查询到的资源量少、查询效率不高而且系统开销巨大的缺陷,提出了基于资源规模的搜索机制.将分散在各个节点上的资源索引信息向局部区域内资源规模较大的节点进行聚集,按照索引规模描述参数的扩散方向建立起冗余的资源索引系统.执行搜索动作时,查询命令沿着资源规模最大的一条路径向前传递,并采用回溯和重新选择邻居节点的方法处理失败的查询命令,在有限的搜索生命期内尽量地向前投递查询请求.对比试验证明:该算法能够在较少的步骤内覆盖对等网络的大部分资源信息,同时系统的开销较低.算法具有较高的查询效率,有效地提高了系统的性能.  相似文献   

9.
SQL Server的全文搜索功能既可以对纯文本字段进行全文查询,也可以对非结构化的二进制字段进行全文查询,后者在建立索引时使用了筛选器。该数据库提供了一些针对微软自身产品文档的筛选器,对于非微软产品的文档则没有提供,这就涉及到自行编写筛选器的问题。文章就筛选器的编写及其在Microsoft SQL Server 2005中的应用作了一些探讨。  相似文献   

10.
为了实现关系数据库上自由态的关键词查询,通过创建索引表并运用其存储的知识为每个属性赋予不同的权值来改进信息检索中传统的排序方法.对每个查询用索引表和改进的排序方法来获得Top-N答案.用实际数据集进行了实验,实验结果表明此方法在查询时间和准确性上是有效的.  相似文献   

11.
针对以多个关键词形成的节点集合作为输入的语义路径包含查询问题,提出了PS-Tree结构,并将其应用到语义搜索引擎的索引结构上.PS-Tree借鉴了面向对象数据库中的集合值属性索引的方法,通过范围查询快速地遍历树形索引,将用户的多关键词查询输入请求对应到包含其语义连接的语义路径上,实现以节点集合作为输入的查询功能.实验结果表明,当查询关键词之间的语义距离较长时,PS-Tree结构表现出良好的性能.  相似文献   

12.
为了实现中职院校学生成绩管理的网络化,方便教师网上录入成绩和学生网上查询成绩。采用Dreamweaver工具、Asp技术和Sql Server 2005数据库技术开发学生成绩自动化管理的信息系统。系统能够实现学生、教师和管理员用户信息管理、学生信息管理、学生成绩管理、课程管理及成绩查询与统计等功能。实践表明,该系统提高了中职院校学生成绩管理的工作效率,有利于推动学校“无纸化办公”的进程。  相似文献   

13.
Lucene是一个纯Java实现的高性能、可扩展的全文信息检索工具库,可以很方便地把它融入到应用程序中来增加索引和搜索功能.分析了Lucene的索引文件结构和搜索排序算法,探讨了Lucene中计算文档与查询项相关度的向量空间模型(VSM).最后,通过实验验证了索引过程的建立以及如何提高索引性能.  相似文献   

14.
Aggregate nearest neighbor(ANN) search retrieves for two spatial datasets T and Q, segment(s) of one or more trajectories from the set T having minimum aggregate distance to points in Q. When interacting with large amounts of trajectories, this process would be very time-consuming due to consecutive page loads. An approximate method for finding segments with minimum aggregate distance is proposed which can improve the response time. In order to index large volumes of trajectories, scalable and efficient trajectory index(SETI) structure is used. But some refinements are provided to temporal index of SETI to improve the performance of proposed method. The experiments were performed with different number of query points and percentages of dataset. It is shown that proposed method besides having an acceptable precision, can reduce the computation time significantly. It is also shown that the main fraction of search time among load time, ANN and computing convex and centroid, is related to ANN.  相似文献   

15.
DNS(domain name system) query log analysis has been a popular research topic in recent years. CLOPE, the represented transactional clustering algorithm, could be readily used for DNS query log mining. However, the algorithm is inefficient when processing large scale data. The MR-CLOPE algorithm is proposed, which is an extension and improvement on CLOPE based on Map Reduce. Different from the previous parallel clustering method, a two-stage Map Reduce implementation framework is proposed. Each of the stage is implemented by one kind Map Reduce task. In the first stage, the DNS query logs are divided into multiple splits and the CLOPE algorithm is executed on each split. The second stage usually tends to iterate many times to merge the small clusters into bigger satisfactory ones. In these two stages, a novel partition process is designed to randomly spread out original sub clusters, which will be moved and merged in the map phrase of the second phase according to the defined merge criteria. In such way, the advantage of the original CLOPE algorithm is kept and its disadvantages are dealt with in the proposed framework to achieve more excellent clustering performance. The experiment results show that MR-CLOPE is not only faster but also has better clustering quality on DNS query logs compared with CLOPE.  相似文献   

16.
视频监控系统中,用户不仅要获取高清视频数据,还需要一种高效的存储机制来管理这些音视频数据,这对于以后录像的查找和回放是至关重要的.设计了一种存储机制,采用ARM9核心的32位RISC处理器GM8180芯片作为嵌入式存储系统的主处理器芯片,以SD卡作为音视频数据的存储媒介.介绍并分析了嵌入式多媒体存储系统SD卡接口驱动,实现了H.264音视频数据DMA方式的传输,缓解了CPU的工作压力,大大提高了存储的效率.最后,根据嵌入式系统实际运行的需要,设计了系统上层存储文件的管理功能.在底层封装的支持下,在存储设备中建立文件系统,并实现相应的存储管理策略,以达到高效方便的管理存储数据的目的.  相似文献   

17.
查询分页技术是Web应用系统中的一项常用技术.传统方法是在客户端或者Web端进行分页,但其在进行海量数据操作时,维护代价高,且查询效率低.通过实验研究可以得出,利用存储过程分页优化算法并结合异步传输技术,在实现海量数据分页时可提高数据的查询效率,实现数据在客户端和服务器之间异步传输.这种方法可大大减少网络瓶颈,使信息显示时不需要重新加载界面,减少了用户等待时间,并能有效减轻服务器的负担.  相似文献   

18.
针对QCR-树聚类个数需事先确定和处理高维空间数据时面临着“维数灾难”的问题,通过自动确定K-means算法的聚类个数和初始聚类中心,来提高聚类质量,并对原始高维空间数据进行近似压缩来减少磁盘读写代价,提高查询效率,提出一种QAAR-树空间索引结构,同时给出QAAR-树的插入、删除和查询算法。实验结果表明,QAAR-树的查询性能优于QCR-树,能够有效地处理海量高维空间数据。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号