共查询到17条相似文献,搜索用时 93 毫秒
1.
2.
3.
郑宇卫 《电脑编程技巧与维护》2015,(4):31-32,58
随着互联网的发展,Web服务作为一个崭新的分布式计算模型已经逐渐成为解决现实应用问题的重要技术.目前开发的Web服务数量逐渐增长,而且不仅局限于以WSDL标准发布的服务,Rest的服务也飞速发展.对这些开放的Web服务进行全面且有效的检索成为一个重要的问题.利用Scrapy爬虫框架抓取服务,利用Lucene针对Web服务的特殊文档格式进行有效索引,完整地提供了Web服务搜索引擎的设计. 相似文献
4.
5.
周杨 《电脑编程技巧与维护》2010,(11):61-64
在简要分析搜索引擎基本原理及相关技术的基础上,以校园网为实验平台,结合小型搜索引擎的个性化需求,利用Lucene开源引擎工具包的系统结构及检索原理设计并实现了一个可扩展、可复用的小型搜索引擎系统。 相似文献
6.
分析全文搜索引擎的基本结构及原理,并使用开源工具Heritrix作为搜索引擎的爬虫负责下载Web页面、HTMLParser抽取Web页面的内容、Lucene提供索引和搜索服务,采用B/S模式实现一个全文搜索引擎。 相似文献
7.
为了提高搜索引擎对新闻检索的准确度,在研究垂直搜索引擎的设计思想和相关技术的基础上,利用Lucene搜索框架设计了新闻垂直搜索引擎.对网络爬虫进行了抓取规则的订制,使其只会抓取新闻相关的网页.采用卡方统计量进行文本特征提取,利用TF*IDF算法进行特征权值计算,利用支持向量机分类算法对新闻数据进行分类.实验结果表明,该新闻垂直搜索引擎可以精准地按类别搜索出新闻信息. 相似文献
8.
网络爬虫采集互联网信息并提供搜索服务。该设计基于Lucene.NET平台开发网络爬虫,可以对特定的网页进行抓取和分析,提取网页中有用信息,并对抓取的数据进行索引,存储到服务器硬盘,同时过滤掉无用信息。系统界面友好,准确高效。 相似文献
9.
Lucene是一个开源的全文搜索引擎工具,利用Lucene的API可以较为方便的创建一个全文搜索引擎。JSF(JavaServerFaces)是一种用于构建Web应用程序的新标准Java框架。它提供了一种以组件为中心来开发Web程序的方法,从而简化了开发。本文将LuCelle和JSF结合起来实现搜索引擎。 相似文献
10.
互联网的快速发展也使搜索引擎不断的发展着,而搜索引擎逐渐转向商业化运行,使得搜索引擎的技术细节越来越隐蔽。文章研究和分析了搜索引擎工具Lucene的原理、模型和索引器,设计了一个搜索引擎系统。该系统采用了非递归的方式负责Web站点的网页爬取以及爬取过程中URL链接的存储、处理等,并通过多线程技术管理多个抓取线程,实现了并发抓取网页,提高了系统的运行效率。最后采用JSP技术设计了一个简易的新闻搜索引擎客户端,系统可以稳定运行,基本符合搜索引擎原理的探索,具有一定的现实意义。 相似文献
11.
当今搜索引擎已经成为人们在网上搜索信息的重要工具.通用的搜索引擎虽然功能强大,但对具有很多子网站的企业门户网站进行搜索时响应速度慢,索引范围不全.Lucene是一个强大的全文索引引擎工具包,应用它可以快速地开发一个搜索引擎.文中描述了利用基于Java的全文检索工具包Lucene开发定制的中文搜索引擎方法,并且将该定制的搜索引擎与Google的站内搜索进行试验比较,发现在对具有很多子网站的企业门户网站进行搜索时有优于Google的性能. 相似文献
12.
基于Lucene的搜索引擎设计与实现 总被引:14,自引:0,他引:14
当今搜索引擎已经成为人们在网上搜索信息的重要工具。通用的搜索引擎虽然功能强大,但对具有很多子网站的企业门户网站进行搜索时响应速度慢,索引范围不全。Lucene是一个强大的全文索引引擎工具包,应用它可以快速地开发一个搜索引擎。文中描述了利用基于Java的全文检索工具包Lucene开发定制的中文搜索引擎方法,并且将该定制的搜索引擎与Google的站内搜索进行试验比较,发现在对具有很多子网站的企业门户网站进行搜索时有优于Google的性能。 相似文献
13.
14.
为实现博客资源的实时和有效搜索,提出以高性能和可扩展的Lucene作为搜索引擎的框架的博客搜索引擎.它充分利用RSS技术和网络蜘蛛技术实现博客资源的快速采集,能够为博客资源的搜索提供良好的支持,并在采集、索引生成及检索三方面的效率和成本上达到一个较为理想的水平. 相似文献
15.
16.
YU Xiao-Shun 《数字社区&智能家居》2008,(32)
该文在开源全文搜索引擎Lucene的基础上设计了一个结合本体与自然语言处理技术的语义检索系统。系统分析了如何对文本进行语义分析,设计了语义索引项以存储语义信息,并提出了使用语义信息的网页排序算法。 相似文献
17.
越来越多的用户在使用搜索引擎时希望能提供快速有效的个性化的查询结果.根据搜索引擎的工作原理,在研究分析开源的搜索引擎工具Lucene的系统架构、模型和索引器的基础上,设计了武警部队网站个性化搜索引擎.通过二阶段数据处理流程实现信息的增量采集,通过采用逆向词典结构实现自动分词以及利用双向分词器进行倒排索引的功能,最后利用Tomcat服务器进行了部署实现.文中所设计的个性化搜索引擎提高了原Lucene搜索引擎的速度和准确率. 相似文献