首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 93 毫秒
1.
一种支持高效检索的即时更新倒排索引方法   总被引:8,自引:1,他引:8  
随着万维网的快速发展,产生了一种全新概念的高效文档索引技术,文章实现了一种支持高效检索及即时更新的倒排索引,它是WebME(WebMiningEnvironment)原型系统的一部分,这部分用来对特定的查询进行高效的检索,并支持即时增量索引,即对新加入的文档可以立即加入索引,且不用重新对原内容进行重索引,并且在更新索引时不会影响查询的进行。  相似文献   

2.
索引结构是搜索引擎的核心,直接影响着搜索引擎的检索性能。本文提出了一种新的索引结构,该结构充分利用字符串前缀个数及排列顺序的潜在规律,在查找过程中有效地重用了先前的匹配信息,提高了检索的效率。  相似文献   

3.
在全文检索中,要使索引具有较好的灵活性,就需有合适的索引结构及更新策略,使得既能有效地实现索引更新,又不影响查询效率.本文设计了一种基于互关联后继树模型的动态更新的索引结构,该索引结构由主索引、附加索引和删除文件列表组成,很好的解决了索引的更新问题.  相似文献   

4.
增量更新关联规则挖掘主要解决事务数据库中交易记录不断更新和最小支持度发生变化时关联规则的维护问题。针对目前诸多增量更新关联规则挖掘算法存在效率低、计算成本高、规则难以维护等问题,提出一种基于倒排索引树的增量更新关联挖掘算法。该算法有效地将倒排索引技术与树型结构相结合,使得交易数据库中的数据不断更新和最小支持度随应用环境不同而不断改变时,以实现无需扫描原始交易数据库和不产生候选项集的情况下生成频繁项集。实验结果表明,该算法只需占用较小的存储空间、且检索项集的效率较高,能高效地解决增量更新关联规则难以维护的问题。  相似文献   

5.
在大型搜索引擎的查询处理过程中,对索引文件的顺序遍历将导致响应时间过长。自索引结构能够有效解决上述问题。为了进一步缩短查询时间,通过对当前索引文件自索引结构的分析,设计了倒排链表的多层自索引结构。此结构以定长元组为单位,使用迭代的方法提取数据段同步点形成上层自索引。在此基础上,实现了索引压缩与查询系统。基于TREC GOV2数据集的测试结果表明,该系统的各项性能指标均优于不采用自索引结构的查询系统,在不影响结果精度的情况下使检索效率得到大幅提升。  相似文献   

6.
吴文娟  车明 《微处理机》2006,27(6):83-85
倒排文件是搜索引擎检索系统普遍采用的索引技术。在实验基础上,针对中文搜索引擎中索引的时效性和传统倒排索引在更新时的缺点,提出分组索引技术和一种追加索引的更新算法,可以有效提高搜索引擎的检索效率,同时不影响系统检索效果。  相似文献   

7.
实时性是影响搜索引擎性能的重要因素.针对这个因素,提出一种可实时更新的倒排索引结构并将其应用于国产万亿次高性能计算平台KD-60.该方案采用主、辅倒排索引和内容过滤索引相结合的方式,实现了搜索过程的实时性.同时,我们将其应用于高性能绿色计算平台KD-60,使之在一定的程度上实现了搜索的高效能.实验证明,基于KD-60平台的倒排索引结构有效的解决了搜索引擎的实时性问题,并可作为绿色计算的实际应用的一个典型实例.  相似文献   

8.
高效地访问倒排索引是搜索引擎快速响应用户查询的关键,而压缩倒排列表是提高搜索引擎性能的最重要的手段之一。针对自适应分段压缩ASCS算法进行了研究,对于ASCS算法中采用的均匀分段方式并非最优分段问题,提出以人工蜂群算法优化ASCS算法中的分段方式;对于ASCS算法考虑序列占用空间的影响因素过于单一问题,提出多因素下的改进算法;对于分布不均的长序列在ASCS算法下压缩率不理想问题,提出先排序后差分编码操作后再以ASCS算法压缩。通过对比实验证明优化改进后的算法可以较显著的压缩倒排索引。  相似文献   

9.
搜索引擎的混合索引技术   总被引:5,自引:0,他引:5  
倒排文件是搜索引擎检索系统普遍采用的索引技术。针对中文搜索引擎中采用自动分词的全文检索因分词词典规模小导致的检索效率下降与词典规模扩大导致检索效果下降的矛盾,论文在天网搜索引擎的实践基础上,提出了一种基于倒排文件实现的混合索引的方法,它可以有效提高搜索引擎下短语查询的检索效率,同时不影响系统检索效果。  相似文献   

10.
随着互联网应用的深入,越来越多的用户希望通过搜索引擎获得特定行业的相关信息,通用搜索引擎无法有效地满足相应需求。文中主要介绍医药行业垂直搜索引擎的设计与实现。设计基于智能搜索引擎的架构,采用了任务驱动的聚焦搜索、隐藏搜索技术;字词混合倒排索引及优化的字倒排索引、检索技术。提供了资源收集阶段的可控策略爬行,和高效的索引、检索功能。实现了针对医药行业的高专业度、高准确率、高效率的信息垂直搜索。  相似文献   

11.
分布式过程实时数据库的一种设计与实现   总被引:1,自引:0,他引:1  
该文设计并实现了一种基于SQLServer的分布式实时数据库,研究了系统在实现过程中的一些关键技术,并用水箱液位的控制系统来验证笔者的设计。  相似文献   

12.
网上实时监测系统采用多层结构模式 ,实现了企业工业控制信息的远程动态显示。文章分析了软件结构模式 ,详细介绍了网上实时监测系统的体系结构 ,并说明了系统的设计与实现方法  相似文献   

13.
SD-DOOD是一个演绎对象数据库实验系统。论文主要是设计并实现了系统的动态更新数据库功能,文中首先给出了详细的实现更新的算法,进而对算法进行了简单分析,最后通过举例说明了这个功能。系统中采用自底向上和自顶向下相结合的更新方式,增强了系统的安全性。  相似文献   

14.
阐述与分析了信息系统用户资料更新设计的基本原理与方法,并利用ASP设计了用户资料网上查找和编辑表单,实现了通过Web浏览器对服务器上Access数据库的用户注册信息进行更新的功能.  相似文献   

15.
文章讨论了网上多点实时语音交互系统的设计和实现,提出了合理实用的多点语音实时交互模型。采用了客户机/服务器模式及UDP通信技术和简捷的数据压缩技术,以Windows环境下TCP/IP协议的Winsock编程接口、有关多媒体的API、DirectX为工具,并以VC++5.0为开发环境,在局域网内实现了一个多点语音实时交互系统。  相似文献   

16.
胡家义  张激  刘玲 《计算机工程》2013,(11):285-288,294
现有嵌入式系统具有应用场景多变、实时性要求严格、上层应用复杂、鲁棒性较强等特点,在嵌入式操作系统层面对系统防危性要求较高。时间隔离机制是提高系统防危性的重要组成部分,为此,提出一种将层次化动态实时调度框架作为时间隔离的实现策略。引入任务同质性的概念进行任务分划,将产生的任务集作为层次框架的基础,证明多层次框架下实时任务的可调度性条件,设计调度算法结构并实现调度算法的动态切换。仿真结果和理论分析表明,该调度框架在保证上下文切换时间复杂度稳宦的前撂下.可楫高秦统防毹性并动态应对系统债载的变化。  相似文献   

17.
建立一套行之有效的网络病毒预警体系,是尽早发现新型网络病毒,并控制其蔓延的有力举措;针对网络病毒发作时会产生大量新IP地址数据包这一特点,采用CUSUM算法对其统计特性进行实时监控,及时发现异常变化,从而对网络病毒进行实时报警,根据统计量的特点,提出了可调的参数设定方法,以更加适应网络环境.通过在计算机上的模拟测试,证明该算法对网络病毒具有较高的检测精度与速度,且运算开销小,代码简单,可以嵌入到网络设备中.  相似文献   

18.
实时网络安全监控系统的设计和实现   总被引:7,自引:1,他引:7  
提出了一种实时网络安全监控系统(Real-time Network Security Monitoring System,RNSMS),讨论了RNSMS的工作模式、实现功能、关键技术等问题。RNSMS能实时地对网络活动进行监控,对常见网络数据包(HTTP,FTP,Tclnet,POP,SMTP,SSL,UDP)内容进行实时分析还原,并加入OPSEC接口,加强与其他网络安全工具的协作互动。应用表明RNSMS是一种有效的网络安全工具。  相似文献   

19.
土地利用基础图件是新一轮国土资源大调查中系列土地调查的基础。本文自主研发出一套软件系统LandXPress,实现了GPS、RS、GIS技术集成支持下的土地利用基础图件的快速更新。其中变化信息的发现与提取这一矢量操作模块是该系统的关键步骤,在全国土地详查中,土地利用基础图件大部分是以SHP文件格式存储的。针对用户的特殊需求,ESRI公司提供了MapObject作为处理SHP文件并进行二次开发的基础组件,但是其价格比较昂贵。为了脱离MapObject的开发环境,笔者利用VisualC++开发环境,开发底层函数访问包对SHP文件进行访问。在该系统中取得了较好的效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号