首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 671 毫秒
1.
随着网络信息量的爆炸式增长,人们查找信息越来越难。Web搜索引擎的出现在一定程度上解决了这种矛盾。然而现行的搜索引擎无法根据用户所指定的主题进行针对性的搜索,因此,必须在搜索后对结果是否属于目标主题进行判断,以提高搜索的准确性,文中提出了一种基于K-近邻机器学习算法的信息自动分类的方法,能够对搜索到的网页自动地判定是否属于目标主题,并在实验的基础上验证了其在提高搜索准确性上的作用。  相似文献   

2.
针对目前通用搜索引擎对林业主题信息覆盖率和查准率较低的不足,提出了一种基于Shark-Search算法的林业主题爬虫设计方案。详细讨论了该主题爬虫的爬行策略、算法描述及实现,并通过实践构建了林业主题搜索引擎"搜林"。实验结果表明,相对于通用搜索引擎,"搜林"减少了搜索结果的信息量,提高了林业主题信息搜索的准确率。  相似文献   

3.
集中式搜索技术有选择地找出与预定义主题集相关的页面,与传统搜索引擎相比具有可针对个人喜好定制,规模小、索引量少,更新查询速度快等特点,设计了一个集中式搜索引擎,并简要介绍该搜索引擎的系统结构,最后实现了一些关键算法。  相似文献   

4.
陈勇  刘勇 《微机发展》2010,(5):162-166
主题搜索网络机器人的研究对于主题搜索引擎整体性能的提高具有重要意义。鉴于国内尚缺少专门面向中医药主题的搜索引擎,针对中医药信息的特点提出了中医药主题搜索网络机器人的搜索策略和系统结构,描述了系统的基本工作流程。结合Java I/O流、套接字编程、多线程编程、中文分词和数据库JDBC连接等技术,设计和实现了中医药主题搜索网络机器人系统。面向中医药主题对如何提高主题搜索网络机器人的搜索效率和精度进行了有益的探索,对其它主题搜索网络机器人的研究和开发具有一定的借鉴作用。  相似文献   

5.
主题搜索网络机器人的研究对于主题搜索引擎整体性能的提高具有重要意义.鉴于国内尚缺少专门面向中医药主题的搜索引擎,针对中医药信息的特点提出了中医药主题搜索网络机器人的搜索策略和系统结构,描述了系统的基本工作流程.结合Java I/O流、套接字编程、多线程编程、中文分词和数据库JDBC 连接等技术,设计和实现了中医药主题搜索网络机器人系统.面向中医药主题对如何提高主题搜索网络机器人的搜索效率和精度进行了有益的探索,对其它主题搜索网络机器人的研究和开发具有一定的借鉴作用.  相似文献   

6.
刘博卿 《福建电脑》2011,27(9):57-58
随着互联网竞争日趋激烈,主题搜索引擎技术日渐发展。本文从基于军事角度出发,对主题搜索引擎进行系统研究,主要基于heritrix,lucene研究了军事主题搜索引擎的系统架构、搜索模块、索引和检索模块的建立。最后通过实验验证了该主题搜索引擎的优劣。  相似文献   

7.
基于网页内容和链接价值的相关度方法的实现   总被引:2,自引:0,他引:2  
专业搜索引擎提供特定主题的信息检索服务,是新一代搜索引擎的发展方向之一,而网页主题相关度分析是专业搜索引擎的核心技术,它指导着robot进行有价值的搜索,专门搜索与主题相关的页面;提出_种综合的网页主题相关度分析方法,方法同时对网页内容价值和链接价值进行了考察,从而保证了robot搜索的网页与主题有着较高的相关度;在网页内容价值评价时,对传统的方法进行了改进,新的方法能高好的实现.该方法也用于服装行业的搜索引擎,效果明显.  相似文献   

8.
定题搜索引擎Robot的设计与算法   总被引:6,自引:0,他引:6  
定题搜索引擎将信息检索限定在特定主题领域,提供特定主题的信息检索服务,是新一代搜索引擎的发展方向之一。该文介绍了一个定题搜索robot系统NetBat 2.02版,它可以实现在web上爬行下载主题相关网页。定题搜索的关键技术是主题相关信息的搜索及网页相关度分析。该文分析了传统定题搜索算法的优缺点,提出了基于反向链接结合超链文本分析的定题搜索算法。文章还对基于内容的网页相关度分析算法进行了详细的论述。对比搜索实验表明系统有着较好的性能,能准确地爬行到主题相关网页。  相似文献   

9.
介绍了一个基于专业搜索引擎的元搜索引擎,提出了一种将专业搜索引擎与专门搜索"Invisible Web"检索工具相结合的方法。在对检索结果进行融合处理时采用建立专业词典的方法来提取主题,并进行主题分类,同时通过记录用户感兴趣的主题,为用户提供个性化服务。  相似文献   

10.
基于K-近邻算法的网页自动分类系统的研究及实现   总被引:2,自引:0,他引:2  
随着网络信息量的爆炸式增长,人们查找信息越来越难。Web搜索引擎的出现在一定程度上解决了这种矛盾。然而现行的搜索引擎无法根据用户所指定的主题进行针对性的搜索,因此,必须在搜索后对结果是否属于目标主题进行判断,以提高搜索的准确性,文中提出了一种基于K-近邻机器学习算法的信息自动分类的方法,能够对搜索到的网页自动地判定是否属于目标主题,并在实验的基础上验证了其在提高搜索准确性上的作用。  相似文献   

11.
徐艳艳  岳伟亚 《软件学报》2009,20(9):2352-2365
增量搜索是一种利用先前的搜索信息提高本次搜索效率的方法,通常可以用来解决动态环境下的重规划问题.在人工智能领域,一些实时系统常常需要根据外界环境的变化不断修正自身,这样就会产生一系列变化较小的相似问题,此时应用增量搜索将会非常有效.另外,基于BDD(binary decision diagram)的启发式搜索,结合了基于BDD的搜索和启发式搜索这两种方法的优点.它既用BDD这一紧凑的数据结构来表示系统的状态空间,又通过使用启发信息来进一步压缩搜索树的大小.在介绍基于BDD的启发式搜索和增量搜索之后,结合这两种方法给出了基于BDD的增量启发式搜索算法--BDDRPA*.大量的实验结果表明,BDDRPA*算法是非常有效的,它可以被广泛地应用到智能规划、移动机器人问题等领域中.  相似文献   

12.
针对目前多数用户难于掌握Win7的搜索功能,介绍了Win7中新的索引搜索模式及使用方法,讨论了Win7搜索条件的类型与格式,给出了构造Win7搜索条件的具体方法,对搜索方式的优化、使用自然语言搜索、删除搜索记录等也做出说明。  相似文献   

13.
传统的案例查询算法通过被动响应用户的查询请求为用户返回与查询请求相关的案例,忽略了用户查询行为能够对案例查询过程进行指导。提出了一个基于用户查询行为模型的案例查询算法,通过收集用户的查询请求,利用用户查询行为之间的相似度建立用户查询行为的分类模型;分析了用户查询行为的分类算法,重点论述了用户查询行为模型对案例查询过程的指导过程。实验结果表明,该方法能够有效地提高查询结果召回率以及查询成功率。  相似文献   

14.
元搜索引擎是一站式搜索引擎,促进人们对网络信息资源的有效利用.通过元搜索引擎的概念、特点和工作原理介绍,对比独立搜索引擎,指出元搜索引擎的资料挖掘等不足,倾向网络搜索,专业搜索欠缺,指出元搜索引擎资料挖掘的发展方向.  相似文献   

15.
Google has been steadily increasing its market share in the US, although its main competitor, Yahoo, began developing a successful knowledge-sharing service in 2005. To verify whether a knowledge-sharing service may increase a search engine’s competitiveness, this study considers the competition between an inferior search engine that has an option of introducing a knowledge-sharing service and a superior search engine without this service. We specifically investigate the conditions under which it would be more profitable for the inferior search engine to introduce a knowledge-sharing service rather than increase its search quality. We show that the inferior search engine’s profit-maximizing strategy mainly depends on both the amount of information available on the Internet and the difference in search quality between it and the superior search engine. When the search quality difference is small, the inferior search engine should introduce a knowledge-sharing service keeping its answer database inaccessible to the superior search engine. When the search quality difference is large, the inferior search engine generally had better improve its search technology. We also show the inferior search engine’s market-share-maximizing strategy when it introduces a knowledge-sharing service.  相似文献   

16.
搜索引擎的目的在于快速有效地找到用户需求的信息,在黄页搜索引擎中,通过关键字搜索,可以返回大量的信息,但其中的大部分信息不在用户需求的范围内.二次检索的定义是,在一次检索结果的基础上,按照特定的条件进行筛选,获得更为满足用户需求的结果.显然,二次检索在黄页搜索中的应用是必要的.基于这样的需求,提出了一种使用内存数据库和黄页搜索引擎联合进行二次搜索的方法.  相似文献   

17.
采用hibernate search技术和lucene技术,设计和实现了基于数据库的站内全文搜索引擎。与基于关键字的搜索和网页搜索相比,能够对搜索内容进行细粒度的搜索控制,查全率和效率也有提高。  相似文献   

18.
Searching within the sample space for optimal solutions is an important part in solving optimization problems. The motivation of this work is that today’s problem environments have increasingly become dynamic with non-stationary optima and in order to improve optima search, memetic algorithm has become a preferred search method because it combines global and local search methods to obtain good solutions. The challenge is that existing search methods perform the search during the iterations without being guided by solid information about the nature of the search environment which affects the quality of a search outcome. In this paper, a spy search mechanism is proposed for memetic algorithm in dynamic environments. The method uses a spy individual to scope out the search environment and collect information for guiding the search. The method combines hyper-mutation, random immigrants, hill climbing local search, crowding and fitness, and steepest mutation with greedy crossover hill climbing to enhance the efficiency of the search. The proposed method is tested on dynamic problems and comparisons with other methods indicate a better performance by the proposed method.  相似文献   

19.
李江华  郑剑 《计算机应用》2012,32(10):2891-2894
为了能够以较高的准确率搜索到用户所需要的领域本体,在分析本体搜索需求和研究用户搜索行为的基础上,提出了一种基于用户行为的启发式本体搜索机制,利用不同用户由于领域认知不同,输入的具有领域共性的搜索关键词不同,实现用户搜索关键词的启发式扩展和搜索匹配度的提高。实验表明,使用该方法执行本体搜索具有较高的准确率和召回率。  相似文献   

20.
分治策略的思想是将一个规模较大的问题分解为多个形式相同的子问题来解决。搜索是指在一个排好序的数组中寻找与给定数值x相等的元素,传统的搜索算法是遍历,而二分搜索是一种基于分治策略的搜索算法。二分搜索是将数组每次分为相等的两部分,将待查元素x与数组中间的元素比较,若相等则搜索成功;否则将搜索范围缩小为原来的一半,之后以此类推,直到找到待查元素,与遍历相比,二分搜索复杂度明显降低。以二分搜索为基础,每次可以将数组分为更多部分,即k分搜索,探寻k为何值时k分搜索算法的时间复杂度最低,能够对搜索算法进一步优化。通过分析、归纳与证明,得出k分搜索的时间复杂度为O(klogkn),由于该函数是递增的,因此二分搜索是效率最高的搜索算法,复杂度为O(log2n);此外,当k=n时,k分搜索退化为遍历,复杂度退化为O(n)。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号