首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 125 毫秒
1.
随着信息技术的发展,网络的迅速普及,搜索引擎在网络用户的生活中扮演着越来越重要的角色,在网络时代,信息检索主要通过Internet搜索引擎进行.Internet提供了多种不同的信息发布和检索方式.讨论新型智能信息搜索技术,使用户成为搜索引擎的主导者,搜索引擎既可以按照既定的算法海量搜索,还可以根据用户输入来抓取信息,达到实时搜索功能,就如何智能分析用户输入,如何抓取网页,怎样获取网页源码,以及关键字的获取与过滤进行了描述与分析.  相似文献   

2.
从搜索引擎看IPv6网络增长   总被引:2,自引:1,他引:1  
文章根据“网络指南针”IPv6搜索引擎近一年来积累的IPv6网页数据,概括了全球IPv6站点数量的增长情况,分析了IPv6站点与IPv4站点引用率的差别,最后得出关于IPv6网络增长的一些结论。  相似文献   

3.
鲁扬 《电子世界》2011,(12):75-75
SEO技术即搜索引擎优化技术,通过研究搜索引擎收录网页和对搜索结果排序的行为规律,针对这些规律对网站进行规划和建设,使得网站在搜索引擎的搜索结果中的排名比较靠前。根据ASP.NET架构网站的特殊性,提出在搜索引擎优化方面的基本方法。  相似文献   

4.
SEO技术即搜索引擎优化技术,通过研究搜索引擎收录网页和对搜索结果排序的行为规律,针对这些规律对网站进行规划和建设,使得网站在搜索引擎的搜索结果中的排名比较靠前.根据ASP.NET架构网站的特殊性,提出在搜索引擎优化方面的基本方法.  相似文献   

5.
翁建元 《电子科技》1999,(16):18-21
使用正确的搜索工具面对海量的网上资源,搜索已成为上网的日常工作。不少人一上网,就直奔Yahoo一这未必能获得理想的返回结果。其实,搜索工具的种类很多,常见的有搜索引擎、web目录搜索和元搜索引擎等。web目录是web站点按主题分类的链接集合,查找时,使用搜索引擎,但返回结果只是一些目录。比如Yahoo,它使用AltaVlsta的搜索引擎,但返回结果由两部分组成:一为主题目录,是引自Yahoo自建的数据库;一为从AI-taVsta搜索返回的网站地址。通常主题目录经过加工和取舍,给出的结果比较有系统性和权威性,而网站列表较具体,却良奏…  相似文献   

6.
谷歌百度均在原有的搜索引擎基础上推出了图像搜索引擎.用户可以使用图像搜索这种全新的方式浏览网络.用户可以通过将网页中或者用户自己计算机中的图片拖拽到搜索窗口中进行搜索.也可以点击相机图标,选择上传图片或者粘贴图片的URL链接进行搜索.分别对谷歌公司和百度公司在图像搜索领域在中国和全球的专利进行统计和分析,对两个公司的申请情况进行了对比,最后在此基础上形成结论并提出建议.  相似文献   

7.
网络信息搜索技术的研究进展   总被引:2,自引:0,他引:2  
刘红 《信息技术》2004,28(4):86-88,92
搜索技术可以分为以分类目录为主的搜索引擎、以网页全文检索为主的搜索引擎和新兴的搜索技术。其中,对称搜索技术是当今搜索技术的代表,本文从对称搜索技术的优越性、对称性、对称搜索引擎的收录范围以及对称搜索技术在商业中的应用三个方面对其进行了介绍。Google是互联网信息搜索技术的代表,文章重点介绍了Google中的对称搜索技术以及Google进行高速搜索的关键一索引,从中可以了解到Coogle取胜的原因。  相似文献   

8.
当前,互联网发展处于“搜索为王”时代,搜索引擎成为网民在互联网上获取信息和服务的主要渠道。2012年我国网民使用搜索引擎的比例已达79.7%。但长期以来各级政府网站上的大量信息尚未被搜索引擎收录,导致多年积累的大量服务资源效能没有得到充分发挥。本文以江西省政府网站为实例分析说明了政府网站搜索引擎优化的实施措施和积极效果。  相似文献   

9.
刘辉  叶绍志  黄晖  李星 《电信科学》2002,18(3):43-45
本文首先介绍了IPv6搜索引擎发展的国内外背景、网络指南针IPv6搜索引擎的主要技术特点和实现;然后基于网络指南针搜索引擎运行过程中得到的数据,从多个角度分析了全球IPv6网络的发展,包括站点的分布、规模、类型等;最后对IPv6的发展趋势进行了展望。  相似文献   

10.
针对图书馆信息资源多采用传统模式搜索信息,搜索结果与需求往往难以匹配,经常会出现"搜"非所问的情况,提出了基于知识图谱的图书馆资源智能搜索.首先,全面梳理搜索引擎的关键技术,对常用的搜索引擎进行分析比较,探讨适合图书馆资源搜索的ElasticSearch的分布式全文搜索系统;其次,提出一套适合图书馆资源知识图谱构建的全...  相似文献   

11.
可定制的聚焦网络爬虫   总被引:1,自引:0,他引:1  
网络资源信息的爆炸式增长、用户越来越个性化的需求,使得针对特定主题的搜索引擎越来越受到青睐.聚焦网络爬虫是主题搜索引擎的重要组成部分,它从Web上下栽针对某一主题的文档.可定制的聚焦网络爬虫是具有主题的可选择性、可定制性的主题爬虫.文中介绍了一套更加有效的爬虫算法,它具有高效(优先下栽主题相关度高的资源)、资源占用少(减少URL队列长度)、主题易移植(主题的可定制性)等特点.  相似文献   

12.
近似镜像网页检测算法的研究与评价   总被引:7,自引:0,他引:7       下载免费PDF全文
王建勇  谢正茂  雷鸣  李晓明 《电子学报》2000,28(Z1):130-132,129
当前在WWW上有众多的近似镜像web页面,如何快速准确地发现这些内容上相似的网页已经成为提高搜索引擎服务质量的关键技术之一.为基于关键词匹配的搜索引擎系统提出了5种近似镜像网页检测算法,并利用“天网”系统对这5种算法进行了实际评测.另外还将它们与现有的方法进行了对比分析.本文所论述的近似镜像检测算法已成功地被用于消除“天网”系统的重复网页,同时也可广泛应用于数字化图书馆的搭建.  相似文献   

13.
对搜索引擎中评分方法的研究   总被引:1,自引:1,他引:0       下载免费PDF全文
韩立新 《电子学报》2005,33(11):2094-2096
针对搜索引擎评分较为困难的问题,文中提出了一种评分方法.该方法使用协同过滤技术,在同一兴趣组中各用户所提供的搜索结果集的基础上,采用文中提出的并行关联规则算法对各用户的局部有向图进行预处理,找出兴趣组中各成员都感兴趣的页面.然后对这些页面的内容和超链接附近出现的文本以及链接结构进行分析.计算权威页面和引导页面,以找到虽不包括在检索结果中,但相关的页面.此外,在对所获得的页面进行评价时,除考虑Web页自身的链接结构和兴趣组中查询用户对页面的评价,还考虑兴趣组中其它成员对页面的评价和所有成员对页面的使用情况等因素,从而使推荐给用户的页面排序更加合理.  相似文献   

14.
CERNET IPv6小组自1998年上半年开始了CERNETv6试验床的建设及IPv6技术的研究工作,目前已建成了覆盖全国8大地区的基于IPv4隧道连接的CERNETv6主干网。CERNETv6从6bone申请到了/24的试验地址,并从APNIC申请到了/35的正式使用地址。同时,在试验床上还开展了IPv4/IPv6过渡技术、路由技术、搜索引擎技术等等IPv6相关技术的研究工作。  相似文献   

15.
Search engine plays an irreplaceable role in web information organizing and accessing. It is very common for Internet users to query a search engine when retrieving web information. Sensitive data about search engine user’s intentions or behavior can be inferred from his query phrases, the returned results pages, and the webpages he visits subsequently. In order to protect contents of communications from being eavesdropped, some search engines adopt HTTPS by default to provide bidirectional encryption. This only provides an encrypted channel between user and search engine, the majority of webpages indexed in search engines’ results pages are still on HTTP enabled websites and the contents of these webpages can be observed by attackers once the user click on these links. Imitating attackers, we propose a novel approach for attacking secure search through correlating analysis of encrypted search with unencrypted webpages. We show that a simple weighted TF–DF mechanism is sufficient for selecting guessing phrase candidates. Imitating search engine users, by querying these candidates and enumerating webpages indexed in results pages, we can hit the definite query phrases and meanwhile reconstruct user’s web-surfing trails through DNS-based URLs comparison and flow feature statistics-based network traffic analysis. In the experiment including 28 search phrases, we achieved 67.86% hit rate at first guess and 96.43% hit rate within three guesses. Our empirical research shows that HTTPS traffic can be correlated and de-anonymized through HTTP traffic and secured search of search engines are not always secure unless HTTPS by default enabled everywhere.  相似文献   

16.
一种评价搜索引擎信息覆盖率的模型及其验证   总被引:4,自引:0,他引:4  
孟涛  闫宏飞  李晓明 《电子学报》2003,31(8):1168-1172
搜索引擎的网页搜集子系统通常以WWW的网页构成的有向图结构为依据,循着网页间的链接进行搜集从而扩大信息覆盖面.本文针对这种信息覆盖能力,建立量化模型从多个角度考察搜集系统对WWW信息资源的覆盖程度.文章首先分析了网页搜集不完全性的若干因素,在指出信息覆盖率的研究意义后提出了三类重要的信息覆盖率概念,然后围绕其中的数量和质量覆盖率展开研究工作.在建立"采样-权值计算-验证"的覆盖率评测模型之后,以北大"燕穹"网页信息博物馆为考察对象并获得其网页数据,用不同的方式对中国Web进行采样;然后分别采用PageRank和HITS两种网页权值算法算出其中的重要网页作为样本,从量和质的角度考察"燕穹"系统的信息覆盖率,得到合理的数量和质量覆盖率值,从而验证了"燕穹"系统信息覆盖率结论的合理性和该信息覆盖率评测模型的可靠性.  相似文献   

17.
语义搜索引擎概念模型   总被引:1,自引:0,他引:1  
语义搜索引擎作为未来的万维网搜索引擎,将不仅仅基于关键词检索,而是能够理解Web页面的内容,并进行逻辑推理来完成复杂的查询任务,最终返回精确的结果。对语义Web和搜索引擎技术进行了简要介绍,提出一种语义搜索引擎概念模型,并对其构成模块及模块问的互操作进行了描述,最后对概念模型具体实现上的关键技术进行了简要说明。  相似文献   

18.
王庆福 《电子测试》2016,(12):76-77
搜索引擎作为目前主要的信息检索工具,提高自身网站在搜索引擎中排名能够给自身网站带来非常大的流量消息并转化为经济收益。SEO技术主要通过一些技术手段来提高搜索时自身网站和用户检索词之间的匹配度从而提高结果排名,这对于企业推广具有非常重要的意义。  相似文献   

19.
基于BP神经网络的Web页面分类算法   总被引:3,自引:0,他引:3  
提出了一种基于BP神经网络的Web页面分类算法。在搜索引擎的结构中提取页面标题、内容标题和内容摘要来表示页面,采用向量空间模型计算分类组合与页面组合的相关性对页面进行矢量化,将训练后的BP神经网络用于对Web页面进行分类。实验结果表明,该分类算法有一定的实用价值。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号