首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
网络爬虫是当今网络实时更新和搜索引擎技术的共同产物。文中深入探讨了如何应用网络爬虫技术实现实时更新数据和搜索引擎技术。在对网络爬虫技术进行深入分析的基础上,给出了一种用网络爬虫技术实现局域网内服务器和客户端之间网络通信的解决方案。  相似文献   

2.
智能搜索引擎是结合了人工智能技术的新一代搜索引擎技术,除了能提供传统的快速内容检索、相关度排序等功能以外,还能提供用户角色识别、搜索内容的语义理解、用户兴趣鉴定、智能化过滤等强大功能。该文将提出了智能搜索引擎的特征、结构及实现技术,并给出了智能搜索引擎在企业人力资源管理决策支持系统中的应用,从而有效地弥补了综合性搜索引擎对企业人力资源决策支持系统中专门领域及特定主题信息覆盖率过低的缺陷。  相似文献   

3.
随着网络的不断普及与发展,搜索引擎的作用逐渐增大。搜索引擎优化实际上就是使网站能够更好地被搜索引擎所收录,并能够实现其优先排序目标,并以网站页面、网站关键词的分析与分布、网站结构、用户体验的改善等方式来具体实现,最终增加网站访问量。本研究将在网站建设中渗透搜索引擎优化技术,在对搜索引擎优化原理及内容进行概述的基础上,提出了搜索引擎优化基本策略及网站建设方法与步骤,对搜多引擎优化及网站建设具有借鉴意义。  相似文献   

4.
《软件工程师》2017,(6):12-14
如今互联网上藏文信息也不断的扩充,藏文搜索引擎作为常用的信息检索的工具和渠道,倒排索引又是搜索引擎的核心技术之一,倒排索引直接影响搜索引擎检索的结果和响应的速度。之所以文章详细介绍了一个自主开发的藏文网页倒排索引系统,它以XML文档的标签内容作为索引对象,定义了文档和文档属性等概念,采用C#语言对文藏文网页正文构建倒排索引的关键技术和实现方法进一步的阐述,实现了基于XML文档的藏文网页倒排索引数据库的底层实现,提供了技术参考。利用这种方法藏文搜索引擎中信息检索的速度和准确率有所提高。  相似文献   

5.
通用搜索引擎与网站提供的站内搜索机制都无法实现基于内容的企业网站信息查找。在分析企业网站信息的类型后,针对该问题提出一个通用站内搜索引擎架构。给出该引擎的设计思想,介绍对象映射匹配方法、加权对象相似度计算算法、索引构建等实现技术。实现基于网页内容、Word与pdf附件内容的查找定位。实验结果显示,该方法具有很高的查准率和查全率。该引擎可为企业网站的内容搜索与个性化服务提供支持。  相似文献   

6.
随着中医药行业的快速发展,中医药相关数字化资源急剧增加,传统的全文搜索引擎因专业性不够强、内容繁多等问题导致用户无法快速方便地找到所需信息.为此,设计并实现了一款面向中医药领域的垂直搜索引擎具有重要的意义和价值.采用Heritrix与Lucene等技术构建中医药垂直搜索引擎——杏林搜索,重点介绍了杏林搜索的设计与实现,包括网络爬虫模块、网页解析模块、索引库和Web端等.实际应用效果表明,杏林搜索可以为用户提供更加快速、专业的中医药资源检索服务.  相似文献   

7.
Win32环境下的NetBIOS协议的编程方法   总被引:1,自引:0,他引:1  
论述了在Windows95、WindowsNT等32位操作系统环境下如何利用NetBIOS协议实现局域网中实时数据通信,并给出了实现实时通信的编程方法,着重论述了如何利用在扩展的NetBIOS协议中提供的异步事件句柄和Win32支持的多线程等新内容进行编程,实现实时数据在局域网中进行实时传输的通信方式。  相似文献   

8.
分析全文搜索引擎的基本结构及原理,并使用开源工具Heritrix作为搜索引擎的爬虫负责下载Web页面、HTMLParser抽取Web页面的内容、Lucene提供索引和搜索服务,采用B/S模式实现一个全文搜索引擎。  相似文献   

9.
张俊  李鲁群  周熔 《微机发展》2013,(6):230-232
互联网搜索的精确性一直是衡量搜索引擎性能的重要标志。针对普通搜索引擎的固有缺陷,文中提出了一种应用于新闻检索的搜索引擎。该引擎是利用开源的网络爬虫工具将互联网信息抓取到本地,并利用Lucene开放的API,对特定的信息进行索引和搜索。Lucene是基于Java开发的源代码开放的全文检索工具包,具有高性能、可扩展等特性,是实现搜索引擎的核心组件。通过对Lucene的API进行分析,并在此基础上,构建了索引和搜索的模块,并对网上新闻内容进行实时地搜索。通过与普通搜索引擎对比,该新闻搜索引擎提高了搜索的精确性。  相似文献   

10.
在分析传统网站内容管理平台优缺点的基础上,介绍了基于Struts2技术的企业网站内容管理平台(tyutCMS)的功能特点及实现方法。重点介绍系统在内容模型设计、模板设计、扩展架构设计、搜索引擎设计和权限控制等方面的内容。最后给出了针对该设计的一个JAVA实现方案。  相似文献   

11.
随着搜索引擎技术的发展,元搜索引擎已经成为搜索引擎的一个重要的研究方向.介绍元搜索引擎的工作原理,对元搜索引擎和一般的元搜索引擎进行比较,指出元搜索引擎的特点,给出一种由.NET实现的元搜索引擎的系统框架,分析系统采用的关键技术.  相似文献   

12.
个性化搜索引擎系统机制的研究   总被引:2,自引:0,他引:2  
随着网络信息资源的迅速增加,个性化信息服务越来越成为信息检索领域中研究的热点,针对传统搜索引擎系统的缺点,提出了一种新型个性化搜索引擎系统的体系结构,并在此基础上给出了系统中个性化机制的相关算法,同时使用基于关键词的搜索,利用Web挖掘技术,在实现为不同用户提供不同检索结果的同时提高了个性化查询的精确度和速度,保证了全查率.  相似文献   

13.
提出一种基于Agent元搜索引擎系统,并且设计智能元搜索引擎的总体框架,描述Agent元搜索引擎系统模块的功能,分析该系统实现的关键技术,通过对系统进行的性能测试表明,系统的查准率和查全率得到了提高。  相似文献   

14.
基于Lucene与Heritrix的图书垂直搜索引擎的研究与实现   总被引:1,自引:0,他引:1  
垂直搜索引擎是针对某一领域的搜索引擎,它可以帮助用户在海量数据面前进行快速、专业、精准的检索。文章研究了垂直搜索引擎的特点,对Lucene与Heritrix的架构与主要模块功能进行了分析,设计并开发了图书垂直搜索引擎系统,为用户提供快捷、专业的图书信息检索服务。  相似文献   

15.
为了更好地利用中文搜索引擎系统,需要了解搜索引擎的一些关键性技术。笔者选择了国内知名度最高的搜索引擎系统百度作为研究对象。介绍了几种常用的中文分词算法以及中文分词在搜索引擎中的作用,并在此基础上采用黑盒的方法推导出百度的中文分词算法——正向最大匹配分词算法。该算法是最常见的一种中文分词算法,比较符合人的思维习惯。了解了搜索引擎的分词算法有益于搜索词设置的优化以及搜索引擎系统的研究和改进。  相似文献   

16.
本文通过分析传统搜索引擎技术不能满足商业领域搜索要求的灵活排序、特殊单字段搜索等需求,提出用新的索引结构和查询算法构建面向商业的搜索引擎系统并予以实现。另外,文章还讨论了其中的索引结构部分,是整个搜索引擎系统的基石。  相似文献   

17.
将Coreseek全文检索引擎应用到分布式数据检索引擎的构建中,利用Python数据源程序接口对多种类型的数据库进行连接,使检索引擎能够同时对不同类型的数据库进行检索。该方法较好地解决了海量数据查询系统中,单极查询性能有限、数据融合复杂问题,提高了系统的数据检索速度和对不同数据库服务器的兼容性。  相似文献   

18.
周凤丽  林晓丽 《微机发展》2012,(1):140-142,160
互联网的快速发展也使搜索引擎不断的发展着,而搜索引擎逐渐转向商业化运行,使得搜索引擎的技术细节越来越隐蔽。文章研究和分析了搜索引擎工具Lucene的原理、模型和索引器,设计了一个搜索引擎系统。该系统采用了非递归的方式负责Web站点的网页爬取以及爬取过程中URL链接的存储、处理等,并通过多线程技术管理多个抓取线程,实现了并发抓取网页,提高了系统的运行效率。最后采用JSP技术设计了一个简易的新闻搜索引擎客户端,系统可以稳定运行,基本符合搜索引擎原理的探索,具有一定的现实意义。  相似文献   

19.
搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。网站优化从狭义上讲,就是指搜索引擎优化,通过提高网站在搜索结果中的排名来吸引更多流量。文中根据搜索引擎工作原理,从网站关键词、链接、网站内容和网站结构四个方面如何针对搜索引擎进行优化提高网站流量和排名进行了分析,以面向人才招聘的网站为优化目标,提出了相应的优化策略。通过邵阳人才网的网站流量和排名提升的搜索引擎优化实例,验证了相应搜索引擎优化技术的有效性。  相似文献   

20.
智能门户搜索引擎技术   总被引:2,自引:0,他引:2  
随着Web息量迅猛增长.传统搜索引擎所查询到的结果由于检索的内容过多,从而造成用户检索到的信息准确度不高,基于智能门户搜索引擎技术的研究已成为搜索引擎发展的新主题。该文详细介绍了智能门户搜索引擎技术,并在此基础上设计了一个智能门户搜索引擎的系统模型(Domain-based Seal-ch Engine,DBSE),该模型采用了多Agent技术以帮助用户快速有效地挖掘有用信息。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号