首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 406 毫秒
1.
使用通用搜索引擎从大量互联网站点中检索违规视频网站或节目,其检索的结果与搜索需求不甚相关,获知的信息缺乏针对性,无法获取满意的查全率和查准率。本文采用了元搜索分布式搜索架构,结合用户反馈经验,对互联网视频节目的相关信息进行采集和索引检索,实现了面向互联网在线视频主题管理的搜索引擎系统。实验数据显示与通用搜索引擎相比,该搜索引擎能更好地实现视频资源的主题聚集,极大地提升了对相关资源的搜索效率。  相似文献   

2.
宫婷 《电信快报》2009,(7):39-41
元搜索引擎综合了多个搜索引擎的搜索结果,提高了搜索的覆盖率,但是它们返回的结果往往数目庞大,并且很多结果与用户查询并不相关。为了提高元搜索引擎的查询精度,文章提出了一种基于用户兴趣的元搜索引擎检索结果合成技术。该技术先对检索结果进行去重、消除死链接.然后根据基于用户兴趣的检索结果优劣比排序算法对结果进行排序,为用户提供贴切的查询结果。该技术能提高用户的检索效率和查询质量。  相似文献   

3.
由于传统系统在实际应用中无法准确计算出网络信息与检索词之间的关联性,导致系统的调和中数数值较低,为此提出基于元搜索引擎的网络信息智能检索系统设计。在系统硬件方面设计了元搜索引擎和检索器,利用元搜索引擎收集海量网络信息,由检索器实现系统网络信息检索功能;在系统软件方面,利用MySQL数据库对系统信息进行存储,并且采用空间向量方式存储网络信息,根据检索词的区分能力以及检索词在网络信息文档出现频率,计算出检索词与网络信息文档的相关度,结合计算结果对检索信息文档进行排序和合并,将合并后的网络信息作为系统最终的检索结果。经实验证明,设计系统调和中数高于传统系统。  相似文献   

4.
元搜索引擎中基于用户兴趣的查询结果合成研究   总被引:3,自引:2,他引:1  
元搜索引擎综合了多个搜索引擎的搜索结果,提高了搜索的覆盖率,但是它们返回的结果往往数目庞大,并且很多结果与用户查询并不相关,这直接影响了用户检索的质量,也大大提高了用户检索的代价。针对这一问题。文章提出了基于用户兴趣的结果合成算法。它根据用户兴趣对结果进行相似度计算和结果去重,从而为用户提供贴切的查询结果。实验表明。该算法提高了用户的检索效率和质量。  相似文献   

5.
元搜索引擎的查询结果合成是元搜索引擎研究的关键环节.提出了一种基于0WA算子的查询结果合成方法.在充分考虑搜索结果文档位置信息的基础上,引入0WA算子整合得到文档在搜索结果中的排列位置综合分值,然后结合用户兴趣类,计算用户查询与查询结果的相似度,最后对两项结果进行加权求和,实现搜索结果的一致性排序.实验结果表明,采用该查询结果合成方法提高了用户检索的准确率和质量.  相似文献   

6.
元搜索引擎综合了多个搜索引擎的搜索结果,提高了搜索的覆盖率,但搜索的结果往往数目庞大,并且很多结果与用户查询并不相关,这直接影响了用户检索的质量,也提高了检索的代价。针对这一问题,提出了基于OWA算子的结果合成算法。它基于用户偏好来获得成员引擎执行某个特定类别查询的性能,采用页面反馈度来给每一个结果页面提供一个基于内容的评分,最后采用乐观OWA算子作为权重函数对结果进行了整合。实验表明,该算法提高了用户的检索效率和质量。  相似文献   

7.
学术搜索引擎为学术创作带来了极大便利,能有效提升科研工作效率。本文对六种学术搜索引擎的性能、检索效率进行比较研究,尝试为科研工作者选择适合工作需要的搜索引擎提供参考,增强科研资料采集能力。  相似文献   

8.
主题搜索是搜索引擎发展的一个新方向。Lucene是目前优秀的搜索引擎开源软件之一。文章以BBS搜索引擎为载体,研究了面向主题搜索引擎的实现和优化,提出了JE中文分词实现方法,针对BBS文本结构特性,改进和优化了Lucene检索评分算法,构建了一套高性能的主题搜索引擎实验系统。通过对水木清华等BBS信息的采集和测试,证明了该主题搜索引擎的性能和效率得到较大改进和提高。  相似文献   

9.
文中研究如何从HTML文档中提取图片相关信息,保证高效和准确的实现图片检索。在对图像搜索引擎检索模式分析的基础上,提出了若干关键技术,设计并实现了一个基于文本的Web图片搜索引擎,给出了系统的总体结构图.并对获取网页、提取信息、图片抓取、建立索引和提供查询进行了详细的描述,分析了图像搜索引擎的检索模式。  相似文献   

10.
牟雪艳 《电子世界》2012,(10):39-39
本文通过对网络信息资源检索工具中的独立搜索引擎的体系结构和工作过程等进行阐述,旨在说明独立搜索引擎的基本工作原理。  相似文献   

11.
随着网络信息量的爆炸式增长,人们查找信息越来越难.Web搜索引擎的出现在一定程度上解决了这种矛盾,介绍中文搜索引擎技术时,首先讲述搜索引擎的发展简史和基本框架,然后介绍各组成部分的工作原理和关键技术.最后对中文搜索引擎的发展进行展望,总结出中文搜索引擎的主要发展方向是:个性化搜索、智能化搜索、多媒体搜索、对等搜索.  相似文献   

12.
信息检索中的聚类分析技术   总被引:1,自引:0,他引:1  
信息检索/搜索引擎技术的快速发展使得信息的查全率有较大提高,而查准率以及人们获取信息的效率改善却不明显。文本聚类和多文档关键词的自动生成技术将有助于解决这一问题。其基本思想是对检索到的部分文档进行聚类处理,并对每类文档自动生成关键词,从而帮助用户判断各个类别的文档和检索需求是否相关。该文提出文档相关度和类别相关度的概念,并利用词频信息以及知网(HOWNET)中词的概念计算模型计算类别相关度,将其作为聚类合并的依据。信息获取的仿真实验表明文档检索效率有较大提高。  相似文献   

13.
14.
为提高传统搜索引擎对农业主题信息的搜索效果,构建了基于BP网络的农业主题搜索引擎,该搜索引擎通过利用多个搜索引擎的搜索结果来提高搜索引擎的查全率,再通过使用BP网络对搜索结果进行二次判断来提高搜索引擎的查准率.  相似文献   

15.
基于 Ontology的个性化元搜索引擎研究   总被引:11,自引:4,他引:7  
文中提出了一种新的基于Ontology的个性化元搜索引擎系统模型,目的是解决现有搜索引擎很难考虑用户兴趣来实现用户个性化搜索问题。提出了基于Ontology的用户描述文件的表达方法和自动隐式学习算法,以及基于Ontology查询结果合成算法。全面描述了系统三层结构以及用户个性化搜索处理过程,并给出了对系统的评价标准。  相似文献   

16.
黄海 《现代电子技术》2011,(24):90-92,98
未来的WWW搜索引擎将不只用于文字搜索,它应该能够理解Web页面的内容,在其上执行逻辑推理,实现复杂的搜索查询并反馈准确结果。创建了一个用于语义搜索引擎的概念体系结构,讨论了其中的构件以及它们之间的交互过程,并证明了此概念体系结构的优越性。现今推理引擎的问题是它们不支持健全的知识库,所以功能限制在了代码验证上。这里提出的概念体系结构不存在这个问题,该体系结构中的推理引擎具有一个完整的知识库。此外,通过使用W3C推荐的OWL语言,语言标准化的问题也得到了很好解决。  相似文献   

17.
The use of search engines within the Internet is now ubiquitous. This work examines how Grid technology may affect the implementation of search engines by focusing on the Signal Data Explorer application developed within the Distributed Aircraft Maintenance Environment (DAME) project. This application utilizes advanced neural-network-based methods (Advanced Uncertain Reasoning Architecture (AURA) technology) to search for matching patterns in time-series vibration data originating from Rolls-Royce aeroengines (jet engines). The large volume of data associated with the problem required the development of a distributed search engine, where data is held at a number of geographically disparate locations. This work gives a brief overview of the DAME project, the pattern marching problem, and the architecture. It also describes the Signal Data Explorer application and provides an overview of the underlying search engine technology and its use in the aeroengine health-monitoring domain.  相似文献   

18.
基于Google的网站优化技术   总被引:2,自引:1,他引:2  
搜索引擎已经成为现在检索信息的重要手段,为了提高网站在搜索引擎中的排名,产生了网站优化的概念,针对目前流行的Google搜索引擎,通过对网站结构的分析,详细阐述了网页结构对基于PageRank算法的网站搜索引擎排名结果可能产生的影响,就如何提升网站在搜索引擎中的排名问题提出了几点优化策略,分析结果表明:对网站结构的优化可以显著提高网站在Google搜索引擎上的排名。  相似文献   

19.
Search engine plays an irreplaceable role in web information organizing and accessing. It is very common for Internet users to query a search engine when retrieving web information. Sensitive data about search engine user’s intentions or behavior can be inferred from his query phrases, the returned results pages, and the webpages he visits subsequently. In order to protect contents of communications from being eavesdropped, some search engines adopt HTTPS by default to provide bidirectional encryption. This only provides an encrypted channel between user and search engine, the majority of webpages indexed in search engines’ results pages are still on HTTP enabled websites and the contents of these webpages can be observed by attackers once the user click on these links. Imitating attackers, we propose a novel approach for attacking secure search through correlating analysis of encrypted search with unencrypted webpages. We show that a simple weighted TF–DF mechanism is sufficient for selecting guessing phrase candidates. Imitating search engine users, by querying these candidates and enumerating webpages indexed in results pages, we can hit the definite query phrases and meanwhile reconstruct user’s web-surfing trails through DNS-based URLs comparison and flow feature statistics-based network traffic analysis. In the experiment including 28 search phrases, we achieved 67.86% hit rate at first guess and 96.43% hit rate within three guesses. Our empirical research shows that HTTPS traffic can be correlated and de-anonymized through HTTP traffic and secured search of search engines are not always secure unless HTTPS by default enabled everywhere.  相似文献   

20.
众所周知,我们处在一个信息爆炸的年代,信息、知识日新月异,面对如此海量的信息资源,我们应该如何从中选取出我们所需要的资料,成了我们必须考虑的重要问题.搜索引擎的出现,让这一切迎刃而解.借助它,我们可以有效搜集我们所需要的资料,从而不断提高学习和工作效率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号