首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
为了满足用户对桌面搜索引擎准确、快速、易用的迫切要求,将通用搜索技术、垂直搜索技术中“先建立索引再进行搜索”的搜索机制和若干功能借鉴到桌面搜索技术,设计并实现了桌面搜索引擎FileFinder.功能测试验证了该软件不仅实现了关键字搜索、文件类型搜索等常用功能,而且具有结果匹配度排序、在搜索结果中再次搜索、以文件附加属性进行搜索等其他桌面搜索引擎不具备而用户需要的功能.对比测试结果既体现了FileFinder在搜索速度上与Windows桌面搜索引擎相比的优势,也表明在不实现全文检索功能的前提下,FileFinder建立索引的时间仅约为Google桌面搜索引擎的一半.  相似文献   

2.
随着互联网应用的深入,越来越多的用户希望通过搜索引擎获得特定行业的相关信息,通用搜索引擎无法有效地满足相应需求。文中主要介绍医药行业垂直搜索引擎的设计与实现。设计基于智能搜索引擎的架构,采用了任务驱动的聚焦搜索、隐藏搜索技术;字词混合倒排索引及优化的字倒排索引、检索技术。提供了资源收集阶段的可控策略爬行,和高效的索引、检索功能。实现了针对医药行业的高专业度、高准确率、高效率的信息垂直搜索。  相似文献   

3.
随着互联网应用的深入,越来越多的用户希望通过搜索引擎获得特定行业的相关信息,通用搜索引擎无法有效地满足相应需求。文中主要介绍医药行业垂直搜索引擎的设计与实现。设计基于智能搜索引擎的架构,采用了任务驱动的聚焦搜索、隐藏搜索技术;字词混合倒排索引及优化的字倒排索引、检索技术。提供了资源收集阶段的可控策略爬行,和高效的索引、检索功能。实现了针对医药行业的高专业度、高准确率、高效率的信息垂直搜索。  相似文献   

4.
主题搜索网络机器人的研究对于主题搜索引擎整体性能的提高具有重要意义.鉴于国内尚缺少专门面向中医药主题的搜索引擎,针对中医药信息的特点提出了中医药主题搜索网络机器人的搜索策略和系统结构,描述了系统的基本工作流程.结合Java I/O流、套接字编程、多线程编程、中文分词和数据库JDBC 连接等技术,设计和实现了中医药主题搜索网络机器人系统.面向中医药主题对如何提高主题搜索网络机器人的搜索效率和精度进行了有益的探索,对其它主题搜索网络机器人的研究和开发具有一定的借鉴作用.  相似文献   

5.
垂直搜索引擎中过滤器的设计与实现   总被引:1,自引:0,他引:1  
从海量Web资源中高效、快捷地检索信息的常规的方法是搜索引擎和信息抽取等技术,而过滤器则起着重要的Web网页预处理作用。提出了基于DOM树结构的过滤器方法,讨论了垂直搜索引擎中页面预处理的方法、设计与实现,并给出了具体的实现算法。最后结合在石油领域垂直搜索引中的具体应用,总结了过滤器适应于当前网页的结构和设计的特点,验证了方法的正确性和适用性,大大提高了垂直搜索引擎的效率和准确率。  相似文献   

6.
基于语义分析的垂直搜索网络蜘蛛   总被引:1,自引:0,他引:1  
通用搜索引擎数据量庞大,但查询结果不够准确.分类目录正好相反.为了综合两者优势,对垂直搜索引擎进行了研究和分析.着重研究了垂直搜索引擎的核心模块--智能网络搜索蜘蛛.提出了搜索分析的新概念--规则.研究了蜘蛛中定义支持同义词的语义词典的方法,给出了按照规则分析和检索的实现方法和流程.程序需要定义多种规则,让蜘蛛依照规则进行网页爬行和信息采集.最后给出一个项目实例,证明了上述方法的可行性.  相似文献   

7.
针对大数据量数据资源的简洁、快速搜索问题,深入研究了基于Lucene的分布式弹性搜索引擎ElasticSearch,简单分析了它的基本原理,详细描述了它的技术框架,并基于ElasticSearch搜索引擎,开发实现了公安信息资源整合与搜索系统,实现了大数据量信息资源的快速整合与一键式分布式准实时搜索,通过可视化监控界面,实时了解系统数据同步与搜索性能,为不断优化其性能奠定了坚实基础.  相似文献   

8.
基于Lucene与Heritrix的图书垂直搜索引擎的研究与实现   总被引:1,自引:0,他引:1  
垂直搜索引擎是针对某一领域的搜索引擎,它可以帮助用户在海量数据面前进行快速、专业、精准的检索。文章研究了垂直搜索引擎的特点,对Lucene与Heritrix的架构与主要模块功能进行了分析,设计并开发了图书垂直搜索引擎系统,为用户提供快捷、专业的图书信息检索服务。  相似文献   

9.
陈勇  刘勇 《微机发展》2010,(5):162-166
主题搜索网络机器人的研究对于主题搜索引擎整体性能的提高具有重要意义。鉴于国内尚缺少专门面向中医药主题的搜索引擎,针对中医药信息的特点提出了中医药主题搜索网络机器人的搜索策略和系统结构,描述了系统的基本工作流程。结合Java I/O流、套接字编程、多线程编程、中文分词和数据库JDBC连接等技术,设计和实现了中医药主题搜索网络机器人系统。面向中医药主题对如何提高主题搜索网络机器人的搜索效率和精度进行了有益的探索,对其它主题搜索网络机器人的研究和开发具有一定的借鉴作用。  相似文献   

10.
随着网络迅速发展,Internet上的资源日趋丰富,搜索引擎被网民广泛使用,搜索引擎的发展为垂直搜索引擎的出现提供了良好的市场空间,本文介绍了基于垂直搜索技术的搜索引擎,并探讨了垂直搜索引擎的优势.  相似文献   

11.
网络信息资源的爆炸式增长使得人们获得有用信息日益困难,随着垂直网站的出现和发展,专业化的垂直搜索引擎成为今后搜索引擎发展的主流.本文介绍了垂直搜索引擎的特点和系统的基本构成,在此基础上采用实证研究的方法,详细介绍了基于手机信息检索的垂直搜索引擎的设计与实现.  相似文献   

12.
为了解决用户能够快速、准确的搜索互联网上数字作品信息的问题,分析设计了一个对数字作品版权唯一标识符(Digital Copyright Identifier简称DCI)数字作品的垂直搜索引擎.首先基于Heritrix网络爬虫技术,对互联网上的数字作品进行数据采集和正文信息抽取,并将抽取的数据保存到本地;然后基于Lucene的全文检索工具包,对本地数据进行分词、倒排索引、索引检索和改进的相关度排序等处理,最终设计实现了一个通用可扩展的DCI垂直搜索引擎.实验结果表明,该搜索引擎在很大程度上提高了网页信息抽取的准确度和数据的检索效率.  相似文献   

13.
基于对象的垂直搜索引擎越来越受到人们的关注,结合这一热门技术,详细介绍了机票比价搜索系统的设计与实现.该系统基于垂直搜索的思想,采用模板方式的网页抽取技术,提供给用户全面的机票信息.  相似文献   

14.
随着网络技术的快速发展,通用搜索引擎已经不能满足用户的一些需求,特别是当用户需要搜索某一领域内的信息时,垂直搜索引擎就正好符合这种需求。以手机资源为背景,通过运用扩展Heritrix和Lucene,构建了一个检索结果比较精准的垂直搜索引擎。研究了通过定制和扩展Heritrix从互联网上爬取相关的信息资源,利用HtmlParser工具对爬取的信息进行分析和抽取,运用Lucene建立全文索引和提供检索服务,并设计了MVC的查询接口。通过响应时间、查全率和查准率的测试实验表明,系统达到了设计目标。  相似文献   

15.
在分析Web社区搜索资源分散特点的基础上,运用Web抓取器、向量空间模型和相关性排序等技术设计了Web社区搜索引擎的体系结构,实现了一个Web社区搜索引擎系统--ChinalabSearch.根据对系统的性能评估,系统满足Web社区的搜索要求,提高了在社区内查找信息的效率,为组织间的合作提供了方便.  相似文献   

16.
为了提高搜索引擎对新闻检索的准确度,在研究垂直搜索引擎的设计思想和相关技术的基础上,利用Lucene搜索框架设计了新闻垂直搜索引擎.对网络爬虫进行了抓取规则的订制,使其只会抓取新闻相关的网页.采用卡方统计量进行文本特征提取,利用TF*IDF算法进行特征权值计算,利用支持向量机分类算法对新闻数据进行分类.实验结果表明,该新闻垂直搜索引擎可以精准地按类别搜索出新闻信息.  相似文献   

17.
为实现博客资源的实时和有效搜索,提出以高性能和可扩展的Lucene作为搜索引擎的框架的博客搜索引擎.它充分利用RSS技术和网络蜘蛛技术实现博客资源的快速采集,能够为博客资源的搜索提供良好的支持,并在采集、索引生成及检索三方面的效率和成本上达到一个较为理想的水平.  相似文献   

18.
随着互联网的演化,搜索作为代表着互联网发展的一面旗帜,它正在快速地、全面地溶入我们的生活,并改变我们的生活。它就像一道桥梁,在你和你所需的信息之间架接起来。搜索技术不断推陈出新,传统搜索引擎开始深挖自己的战壕,新兴搜索引擎求新求变,争相异军突起。搜索引擎的发展改写了传统门户确立的商业规则,智能化搜索、社会化搜索、垂直搜索等成为新的亮点。互联网搜索公司是当下资本市场的热点,自然也是全球各大著名媒体评选的最具潜力科技创新公司100强的关注焦点。本期介绍的Simply Hired,Wikia等公司均在入选之列,他们正是垂直搜索,社会化搜索等新兴搜索的代表,是下一代互联网公司的最有力竞争者。  相似文献   

19.
莫倩  张树  王芳 《计算机工程与应用》2012,48(21):112-117,150
传统的主题搜索技术难以适应大范围垂直领域的智能搜索需求,通过将主题搜索与语义搜索相关技术分别应用到搜索引擎的数据采集与智能查询过程中,利用基于层次分类模型的领域数据采集机器人,完成对领域信息的精准采集,基于中文百科资源自动构建领域本体,将大规模领域本体库用于搜索引擎的语义扩展推理中,实现了一个面向领域的智能搜索引擎。实验结果表明,基于层次结构的领域分类具有较高的分类准确率和召回率,与其他搜索引擎相比较,该系统具有领域专业性强、领域易于移植、检索更加智能等特点。  相似文献   

20.
刘石  李合  王啸吟  张路  谢冰 《计算机科学》2009,36(8):165-168
通过示例代码学习简单算法的实现和具体API的使用方式是程序开发人员在软件开发中进行软件复用的高效手段,也是使用代码搜索引擎的主要目的.代码搜索引擎从网页搜索技术发展而来,提供对网络上源代码资源的检索功能,能够有效定位与搜索内容相关的代码,为程序开发人员提供帮助.但现有的代码搜索引擎没有在搜索结果中区别API的实现代码与使用代码,搜索结果存在冗余,导致用户无法快速有效地找到提供有用信息的代码片段.为了使用户更好更快地找到代码搜索目标,阐述了应用语法与语义分析技术从区分API实现代码和使用代码、相似代码聚类、搜索结果摘要3个方面对代码搜索结果进行优化的方法,给出了一个代码搜索引擎的实现,并在实例研究中展示了该方法的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号