首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
Lucene是一个用Java写的全文检索引擎工具包,面向对象多层封装,提供了一个低耦合、与平台无关的、可进行二次开发的全文检索引擎架构,是这几年最受欢迎的信息检索程序库;基于流式Socket的网络编程是设计网络通信程序的一种有效方法.本文基于Lucene,采用中文分词技术,设计并实现了中文搜索引擎,同时应用Java和PHP的Socket网络编程技术,实现了外网通过PHP网页使用Lucene服务的功能.  相似文献   

2.
在简要分析搜索引擎基本原理及相关技术的基础上,结合小型搜索引擎的个性化需求,利用Lucene开源引擎工具包的系统结构及检索原理设计并实现了一个可扩展、可复用的小型搜索引擎系统。  相似文献   

3.
主题搜索是搜索引擎发展的一个新方向。Lucene是目前优秀的搜索引擎开源软件之一。文章以BBS搜索引擎为载体,研究了面向主题搜索引擎的实现和优化,提出了JE中文分词实现方法,针对BBS文本结构特性,改进和优化了Lucene检索评分算法,构建了一套高性能的主题搜索引擎实验系统。通过对水木清华等BBS信息的采集和测试,证明了该主题搜索引擎的性能和效率得到较大改进和提高。  相似文献   

4.
5.
基于当前最流行的全文检索引擎架构Lucene,文章设计并实现了一个中文分词模块。分词模块中的核心算法是基于字符串匹配与统计相结合的中文分词算法,其主要研究目的在于寻找更为有效的中文词汇处理方法,提高全文检索系统的中文处理能力。通过实验发现,该模块的分词准确率较高,分词速度有进一步的提升空间。下一步我们将通过多种改进措施,来完善该分词模块,最终构建出一个高效的中文全文检索系统。  相似文献   

6.
在理论研究的基础上,本文还利用Java技术对搜索引擎的三个核心部分即网络蜘蛛、网页索引、搜索进行了实现。索引和搜索部分借助Lucene全文搜索引擎库中的Java类进行实现。实现搜索引擎的个性化,使搜索引擎具有自我学习的功能,能自动地适应用户的查询需求,并能对用户进行智能分类从而为搜索引擎的个性化提供依据。  相似文献   

7.
为了满足电力领域用户对电力新闻实时性和个性化需求,在基于Lucene和改进的Heritrix爬虫框架下,设计实现了电力新闻垂直搜索引擎,为电力领域用户提供准确、及时、高效的电力新闻检索服务。  相似文献   

8.
一种实用元搜索引擎的设计与实现   总被引:1,自引:1,他引:1  
元搜索引擎结果集成算法的性能直接影响元搜索引擎的查询精度和用户的满意度.文中在分析常用的结果集成算法的基础上,提出了一种改进的结果处理算法来提高查询精度,并设计了元搜索引擎系统.实验表明,该系统可以有效提高信息检索的精度.  相似文献   

9.
一、中文网址与搜索引擎的区别 搜索引擎是一种强有力的查找网站的工具.它通过对网络上所有网站的全文进行搜索找到匹配的关键字,然后向用户提交查询结果.因此搜索引擎往往会为用户提供动辄上百个网址,搜索结果利用率很低.中文网址不是一个全文检索工具,而是一个对现在通用的域名和网址再次转换的过程.它会引导访问者直接到达所需页面,这个页面可以是网站目录结构深处的页面,中文网址会将访问者直接带到该页面,而不需要访问者一层一层的深入查询.因此中文网址具备快速、精确、直接的特点.  相似文献   

10.
设计实现了一个基于Lucene的中文分词模块,提出了一种更为有效的中文词处理方法,提高全文检索系统的中文处理能力.整个模块基于当前使用较为广泛的全文检索引擎工具包Lucene,结合正向最大匹配算法以及经过优化的中文分词词典,以实现更高效率和准确度的中文分词功能.在系统评测方面,通过实验仿真比较了该模块与StandardAnalyzer和CJKAnalyzer在功能和效率上的差异.对于如何构建一个高效的中文检索系统,提出了一种实现方案.  相似文献   

11.
Query by Singing/Humming (QBSH) is a most natural way for music search. A music search system can help music finders search songs by matching a part of melody by singing or humming. Many music information retrieval techniques have been developed to carry out music search for years. On the other hand, thanks to the rapid growth of mobile wireless Internet technologies this decade, music search applications can be implemented on hand-carried devices, such as cellular phones, to conduct music search anytime and anywhere via any available networks, such as Wi-Fi, UMTS, WiMAX to the emerging 3GPP-LTE networks. In the past, little studies had ever been revealed about how to design and implement a lightweight music search engine over a fixed or mobile Internet. In this article, we aim to elaborate a practical skeleton of developing a simple music search engine over fixed or mobile networks—a Fixed-Mobile Convergent Music Search Engine (FMC-MUSE). FMC-MUSE can process music queries by QBSH from fixed or mobile clients and return a dataset containing the search results and meta-info back to music finders via ubiquitous networks.  相似文献   

12.
针对通用搜索引擎的信息量大、查询不准确、深度不够等问题,给出了面向主题的垂直搜索引擎的体系结构,设计了垂直搜索引擎系统的爬行策略,对系统核心信息采集模块运用了多线程技术及基于VSM的主题相关度判断算法进行主题网页爬行,并通过Lucene.Net的索引与检索技术建立系统的检索算法,实现了一个面向特定主题的垂直搜索引擎应用系统.实验测试结果表明,该系统具有较高的提取效率,其检索的准确率、召回率均大大高于通用搜索引擎,具有较好的实用价值和商业应用前景.  相似文献   

13.
随着网络信息量的爆炸式增长,人们查找信息越来越难.Web搜索引擎的出现在一定程度上解决了这种矛盾,介绍中文搜索引擎技术时,首先讲述搜索引擎的发展简史和基本框架,然后介绍各组成部分的工作原理和关键技术.最后对中文搜索引擎的发展进行展望,总结出中文搜索引擎的主要发展方向是:个性化搜索、智能化搜索、多媒体搜索、对等搜索.  相似文献   

14.
Google是目前最受欢迎的搜索引擎,其强大的检索功能给我们带来便利的同时也带来了很多的安全隐患。文章从Google的引擎实现和检索功能入手,论述了GoogleHacking的原理及防范方法。  相似文献   

15.
P2P搜索技术是P2P研究中的一个重要的领域.文中介绍了一个基于P2P结构化覆盖网络的分布式搜索引擎的架构和实现.该搜索引擎采用了三层架构,良好的层次架构减少了搜索引擎核心算法与P2P覆盖网络协议和具体应用间的依赖,使得搜索引擎可以移植到不同的P2P结构化覆盖网络之上.由于P2P搜索过程中会消耗大量的网络带宽,所以该搜索引擎使用了一些优化算法,它们不仅减少搜索过程带来的带宽消耗,而且保证了系统的可伸缩性.  相似文献   

16.
孟庆鑫 《电子技术》2011,38(3):56-60
为了有效挖掘XML文档集中标签之间、结构之间的语义相似度,以便能够在检索时返回同义异构的XML数据,并对返回结果的质量进行语义级的评估,首先需要分析关键词之间的语义关系.为此,本课题首先研究如何通过分析XML文档集中结点内容的语义信息,抽取XML文档中关键词的语义类型以及关键词之间的语义关系;进而计算关键词间的语义相似...  相似文献   

17.
孙志  张莉 《电子世界》2012,(19):8-10
目前校园网中的资源日益丰富,如何快捷高效地搜索校园网资源已成为亟需解决的重要问题。讨论了校园网中搜索引擎的特点,并提出了一种中小型校园网搜索引擎的实现方案。实践证明,该方案经济可行。  相似文献   

18.
高性能分布式搜索引擎Solr的研究与实现   总被引:1,自引:0,他引:1  
针对信息资源不断膨胀传统搜索技术无法达到高效、可靠的服务需求问题。设计并实现了一中基于Solr的高性能分布式搜索。系统通过使用Zookeeper管理集群,实现搜索模块分布式,利用Solr做索引处理,在多节点上并行创建索引,并将SolrCloud与Mongodb数据库的搭建连接,通过测试表明,系统展现了SolrCloud对数据库搜索功能的提高效果  相似文献   

19.
智能搜索引擎中用户兴趣模型分析与研究   总被引:11,自引:0,他引:11  
用户兴趣模型是智能搜索引擎系统中的重要组成部分。本文提出一种新的方法.以动态询问的方式建立初始用户兴趣模型,通过分析、学习用户浏览行为历史.动态更新用户兴趣模型,有效地解决了用户兴趣的自适应变化。  相似文献   

20.
用户界面是人与机之间交流,沟通的层面,是软件产品的重要组成部分,本文提出一种基于控件显示属性自动记录的界面设计思路,以在Delphi中的数据表格控件(DBGrid)的列宽属性的自动设置为例,说明智能用户界面的实现的设计思路与方案。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号