共查询到19条相似文献,搜索用时 31 毫秒
1.
企业级搜索引擎技术在博客网站中的应用 总被引:1,自引:0,他引:1
随着网络技术的发展和广泛应用,安全的监控网站内容已成为研究的热点之一.根据博客网站体系结构的特点,提出采用企业级搜索引擎技术监控其内容的方法,将索引词库中的词条与非法关键字表进行比较,及时发现非法数据,然后通过审查程序发送信息给管理人员,从而能及时处理问题网页,达到实时和有效的个性化监控,极大地减轻了管理人员的工作负荷.测试实验结果表明,该系统在保证查全率和查准率的基础上,提高了搜索效率并满足了对网站内容的监控要求. 相似文献
2.
为实现博客资源的实时和有效搜索,提出以高性能和可扩展的Lucene作为搜索引擎的框架的博客搜索引擎.它充分利用RSS技术和网络蜘蛛技术实现博客资源的快速采集,能够为博客资源的搜索提供良好的支持,并在采集、索引生成及检索三方面的效率和成本上达到一个较为理想的水平. 相似文献
3.
本文通过对垂直搜索引擎的工作原理与主要技术进行分析,给出了一种基于开源Nutch上实现中文垂直搜索引擎的方案。 相似文献
4.
6.
7.
作为一种功能强大的搜索引擎,Google 的背后似乎隐藏着巨大的奥秘。本文是Google 的两位创始人在1998年国际互联网大会上发表的论文,通过对Google 进行完整的剖析,帮助读者理解Google 的实现过程。 相似文献
8.
本文对Web中文信息检索进行了简介,分析了Web中文信息检索的几个关键技术,总结时下流行的中文搜索引擎技术。笔者还提出了一些心得、体会和设想,最后对智能中文搜索引擎进行了展望。 相似文献
9.
互联网的快速发展也使搜索引擎不断的发展着,而搜索引擎逐渐转向商业化运行,使得搜索引擎的技术细节越来越隐蔽。文章研究和分析了搜索引擎工具Lucene的原理、模型和索引器,设计了一个搜索引擎系统。该系统采用了非递归的方式负责Web站点的网页爬取以及爬取过程中URL链接的存储、处理等,并通过多线程技术管理多个抓取线程,实现了并发抓取网页,提高了系统的运行效率。最后采用JSP技术设计了一个简易的新闻搜索引擎客户端,系统可以稳定运行,基本符合搜索引擎原理的探索,具有一定的现实意义。 相似文献
11.
网络搜索是目前从因特网上获取信息的主要手段,而网络蜘蛛又是大多数网络搜索工具获取网络信息的主要方法,主题搜索策略是专业搜索引擎的核心技术.通过研究网络蜘蛛的工作原理,分析了网络蜘蛛的搜索策略和搜索优化措施,设计出一种将限制搜索深度.多线程技术和正则表达式匹配方法结合一起的网络蜘蛛,实验结果表明该方法能够快速而准确地搜索所需的相关主题信息. 相似文献
12.
随着Internet的迅速发展,传统的搜索引擎在覆盖度、查询精度、可扩展性和用户多样化需求等方面存在许多不足。本文详细介绍了多搜索引擎技术,以及在该技术基础上实现的多搜索引擎系统。多搜索引擎系统通过集成目前流行的多个搜索网站,提供更强大的搜索功能,帮助用户更快速更有效地获得所需信息。 相似文献
13.
元搜索引擎的现状与发展 总被引:7,自引:1,他引:7
元搜索引擎利用现有的独立搜索引擎的查询性能,将搜索引擎看成一个整体,为用户提供一个统一的查询界面与返回结果。介绍了目前网络上比较著名和流行的一些元搜索引擎,对近几年来关于元搜索引擎的研究进行了分析总结,旨在为对元搜索引擎的进一步研究提供参考。 相似文献
14.
15.
16.
基于改进网络爬虫技术的SQL注入漏洞检测* 总被引:5,自引:1,他引:4
网络爬虫在搜索引擎领域广泛使用,SQL注入漏洞检测属于Web服务和数据库安全的范畴。为了提高网站的安全性,及时、有效地发现网站存在的SQL注入漏洞,改进了现有的网络爬虫技术,应用到对网站SQL注入漏洞的检测中,丰富了检测的手段,降低了检测的漏报率。最后通过实验证明了该技术的可行性。 相似文献
17.
为了满足用户对桌面搜索引擎准确、快速、易用的迫切要求,将通用搜索技术、垂直搜索技术中“先建立索引再进行搜索”的搜索机制和若干功能借鉴到桌面搜索技术,设计并实现了桌面搜索引擎FileFinder.功能测试验证了该软件不仅实现了关键字搜索、文件类型搜索等常用功能,而且具有结果匹配度排序、在搜索结果中再次搜索、以文件附加属性进行搜索等其他桌面搜索引擎不具备而用户需要的功能.对比测试结果既体现了FileFinder在搜索速度上与Windows桌面搜索引擎相比的优势,也表明在不实现全文检索功能的前提下,FileFinder建立索引的时间仅约为Google桌面搜索引擎的一半. 相似文献
18.
琚洁慧 《计算机工程与设计》2007,28(7):1632-1635
由于网页质量千差万别,对网页进行基于网络链接图的质量排序变成了现代搜索引擎的一个重要部件.分析了对网络排序模块的实现进行优化时,造成大规模稀疏矩阵-向量乘法运算低效的原因,并结合网络链接图的实际情况提出了几种不同的优化策略.然后,对几种优化策略做了实验性能比较,并综合考虑各种优化策略的运算效率和存储量需求,选择了适合实际系统的优化策略.同时,提出PageRank算法在实现时的一个变通处理--除汇. 相似文献
19.
在分析了传统FTP搜索引擎在处理资源的时效性不足的基础上,提出了一个高效的层次型结构FTP动态搜索引擎系统模型,通过建立网络节点空间,改进信息搜索策略与存储机制,引入区域负责机制与非同步检索的概念,提高搜索速度与搜索准确率,保证了搜索结果在检索请求提交时的有效性与可靠性。 相似文献