首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 109 毫秒
1.
针对通用搜索引擎的信息量大、查询不准确、深度不够等问题,给出了面向主题的垂直搜索引擎的体系结构,设计了垂直搜索引擎系统的爬行策略,对系统核心信息采集模块运用了多线程技术及基于VSM的主题相关度判断算法进行主题网页爬行,并通过Lucene.Net的索引与检索技术建立系统的检索算法,实现了一个面向特定主题的垂直搜索引擎应用系统.实验测试结果表明,该系统具有较高的提取效率,其检索的准确率、召回率均大大高于通用搜索引擎,具有较好的实用价值和商业应用前景.  相似文献   

2.
对三种存储过程分页算法的响应速度进行比较.采用WAST1.1测试工具,对每种算法分别以5个不同级别的记录数进行测试,并记下满足查询条件的记录数首页、末页的第一个字节到达客户端的时间(即TTFB).对于小数据量,三种算法中首页、末页的TTFB相差不大;对于大数据量,算法Ⅰ和算法Ⅱ的首页、末页的TTFB相差较大,而算法Ⅲ却相差无几.在海量数据下,算法Ⅲ是三者中效率最高的分页算法.  相似文献   

3.
吉向东 《信息技术》2009,33(9):106-108
设计和实现了一个基于搜索引擎Crawler技术的超链接测试系统.通过将Crawler的爬行范围限制在一个网站之内,系统可以自动对待测网站进行扫描,有效地找出烂链和孤页.测试表明,相对于其它超链接测试产品而言,系统的测试自动化程度较高,为测试人员提供了较为丰富的控制手段.  相似文献   

4.
主题搜索是搜索引擎发展的一个新方向。Lucene是目前优秀的搜索引擎开源软件之一。文章以BBS搜索引擎为载体,研究了面向主题搜索引擎的实现和优化,提出了JE中文分词实现方法,针对BBS文本结构特性,改进和优化了Lucene检索评分算法,构建了一套高性能的主题搜索引擎实验系统。通过对水木清华等BBS信息的采集和测试,证明了该主题搜索引擎的性能和效率得到较大改进和提高。  相似文献   

5.
高校网站着陆页在设计的时候势关学校的定位及网站的seo,关系着网站用户的访问便捷性及粘性,所以,高校网站在设计着陆页的时候,应该全方位的考虑,不仅注重符合网页设计的一般要求,更应注重用户的体验,使网页不仅仅能够符合百度等搜索引擎收录的要求,而且能够体现出高校网站的特点,本文就高校网站着陆页的设计做了简单的解析。  相似文献   

6.
陈珂  杜智超  叶松  王颀  霍宗亮 《电子学报》2018,46(11):2619-2625
为减小共源线噪声对NAND闪存读可靠性的影响,设计了一种可实现C/F(Coarse/Fine)读取操作的页缓存器电路,并设计实现了适用于此电路的C/F读取算法,显著减小了共源线噪声.该算法通过两次子读感应读取存储单元,在第一次子读感应中分辨出阈值电压较低的存储单元并标记在页缓存器中,使其不再进行第二次子读感应,从而减小共源线噪声引起的阈值偏移.电路仿真计算表明,该支持C/F读取算法的页缓存器结构能够减小阈值偏移至少495.6mV,有效提高了NAND闪存读操作的精确性.  相似文献   

7.
为提高传统搜索引擎对农业主题信息的搜索效果,构建了基于BP网络的农业主题搜索引擎,该搜索引擎通过利用多个搜索引擎的搜索结果来提高搜索引擎的查全率,再通过使用BP网络对搜索结果进行二次判断来提高搜索引擎的查准率.  相似文献   

8.
为了提高查询精度,提出了一种个性化元搜索引擎模型.在该模型中,引入了一种基于用户兴趣模型的加权位置/摘要的查询结果排序算法,该算法综合考虑了查询结果的摘要与查询的全局相关度、查询结果在各个成员搜索引擎返回结果中的排列位置信息、各个成员搜索引擎对查询意图主题类别的相关度三方面的信息.实验表明该排序算法能较好地把与用户查询意图相关的结果排在查询结果的最前面,提高了查准率.  相似文献   

9.
HITS算法是基于超链接结构的搜索引擎算法,但它对超链接不加以区分,容易产生"主题漂移"现象.改进后的HITS算法在原算法的基础上,提出了相似度量的迭代方法.该方法是将网页超链接结构信息、文本信息、联合引用信息结合成一个相似度量权重矩阵,通过权重矩阵来归一HITS算法每次产生的Authority、Hub值.在查询效率和质量方面,改进的HITS算法更优,也减少了"主题漂移"现象的发生.  相似文献   

10.
本文介绍了KEIL中分页项目的建立过程及注意事项,对分页的实现细节进行了分析,指出存在的问题及解决方案,以ST公司的μPSD器件为例介绍了如何对分页代码进行修改.  相似文献   

11.
Focused crawlers (also known as subject-oriented crawlers), as the core part of vertical search engine, collect topic-specific web pages as many as they can to form a subject-oriented corpus for the latter data analyzing or user querying. This paper demonstrates that the popular algorithms utilized at the process of focused web crawling, basically refer to webpage analyzing algorithms and crawling strategies (prioritize the uniform resource locator (URLs) in the queue). Advantages and disadvantages of three crawling strategies are shown in the first experiment, which indicates that the best-first search with an appropriate heuristics is a smart choice for topic-oriented crawling while the depth-first search is helpless in focused crawling. Besides, another experiment on comparison of improved ones (with a webpage analyzing algorithm added) is carried out to verify that crawling strategies alone are not quite efficient for focused crawling and in most cases their mutual efforts are taken into consideration. In light of the experiment results and recent researches, some points on the research tendency of focused crawler algorithms are suggested.  相似文献   

12.
搜索引擎系统中个性化机制的研究   总被引:3,自引:0,他引:3  
随着Internet的飞速发展,搜索引擎系统越来越成为信息检索领域中的研究热点,文章针对传统搜索引擎系统的缺点.设计了一种新型个性化搜索引擎系统的体系架构,能够针对不同用户提供不同的检索结果,并给出了系统中个性化机制的相关算法。模拟实验表明,该结构和算法能够有效地提高检索结果的准确度。并且具有良好的可适应性。  相似文献   

13.
基于望远镜搜索的块匹配运动估值的低功耗VLSI结构   总被引:1,自引:0,他引:1  
在一种基于望远镜搜索的块匹配运动估值的 VL SI实现中 ,对用于加速搜索的传统心动阵列引擎进行了结构上的改进 ,从而能够显著地降低功耗 .方法是使用一种新的块匹配误差计算的提早跳出技术 ,并通过在阵列处理单元中屏蔽操作数来避免不必要的计算操作 .基于算法模拟结果的简单估计表明 :使用新结构搜索引擎的运动估值 ,功耗可降低到原来的 40 %左右 ,而仍然保持着相同的处理速度和相似的视频解码图质量 .  相似文献   

14.
在一种基于望远镜搜索的块匹配运动估值的VLSI实现中,对用于加速搜索的传统心动阵列引擎进行了结构上的改进,从而能够显著地降低功耗.方法是使用一种新的块匹配误差计算的提早跳出技术,并通过在阵列处理单元中屏蔽操作数来避免不必要的计算操作.基于算法模拟结果的简单估计表明:使用新结构搜索引擎的运动估值,功耗可降低到原来的40%左右,而仍然保持着相同的处理速度和相似的视频解码图质量.  相似文献   

15.
黄海 《现代电子技术》2011,(24):90-92,98
未来的WWW搜索引擎将不只用于文字搜索,它应该能够理解Web页面的内容,在其上执行逻辑推理,实现复杂的搜索查询并反馈准确结果。创建了一个用于语义搜索引擎的概念体系结构,讨论了其中的构件以及它们之间的交互过程,并证明了此概念体系结构的优越性。现今推理引擎的问题是它们不支持健全的知识库,所以功能限制在了代码验证上。这里提出的概念体系结构不存在这个问题,该体系结构中的推理引擎具有一个完整的知识库。此外,通过使用W3C推荐的OWL语言,语言标准化的问题也得到了很好解决。  相似文献   

16.
P2P搜索技术是P2P研究中的一个重要的领域.文中介绍了一个基于P2P结构化覆盖网络的分布式搜索引擎的架构和实现.该搜索引擎采用了三层架构,良好的层次架构减少了搜索引擎核心算法与P2P覆盖网络协议和具体应用间的依赖,使得搜索引擎可以移植到不同的P2P结构化覆盖网络之上.由于P2P搜索过程中会消耗大量的网络带宽,所以该搜索引擎使用了一些优化算法,它们不仅减少搜索过程带来的带宽消耗,而且保证了系统的可伸缩性.  相似文献   

17.
个性化搜索引擎中用户协作推荐算法的研究   总被引:7,自引:2,他引:5  
个性化信息服务越来越成为信息检索领域中研究的热点,文章综合内容过滤和协作过滤两种技术的优点,给出了一种个性化搜索引擎系统的体系结构,并在此基础上提出了用户协作推荐算法.模拟实验表明,该结构和算法能够有效地推荐出与用户意图相关的信息,并且具有良好的可适应性.  相似文献   

18.
Lucene是一个用Java写的全文检索引擎工具包,面向对象多层封装,提供了一个低耦合、与平台无关的、可进行二次开发的全文检索引擎架构,是这几年最受欢迎的信息检索程序库;基于流式Socket的网络编程是设计网络通信程序的一种有效方法.本文基于Lucene,采用中文分词技术,设计并实现了中文搜索引擎,同时应用Java和PHP的Socket网络编程技术,实现了外网通过PHP网页使用Lucene服务的功能.  相似文献   

19.
本文给出了一种新的块匹配运动估计算法,它根据视频图像内容的复杂程度自适应地选择常规的或者低比特分辨率的图像来进行块匹配,并且采用了一种混合使用两种比特分辨率图像的新望远镜搜索算法.模拟结果表明,新算法具有较低的计算复杂性,并且能够保证较好的视频质量.基于该算法,我们设计了一种新的脉动阵列结构的搜索引擎.该引擎具有可分割的数据通道,从而在使用低比特分辨率图像进行块匹配时能够通过加强处理的并行性来提高吞吐率.新的运动估计器可工作在较低的时钟频率和电源电压之下,具有低的功耗消耗.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号