首页 | 本学科首页   官方微博 | 高级检索  
 共查询到18条相似文献,搜索用时 203 毫秒
当前,搜索引擎是互联网的一个重要组成部分.其网页摘要采用的是静态网页额摘要,用户不能快速从网页 摘要中获取网页内容的主题思想.本文在开源搜索引擎Nutch中运用自动文摘技术生成网页摘要,加快用户确认搜索准确 度的速度.  相似文献   

谷歌彻底改变了我们度假、购物、工作及娱乐的习惯,如今,谷歌的"知识图谱"再次计划颠覆互联网的搜索方式。知识图谱是什么?它们能做到吗?搜索技术日新月异,如今它不再是在搜索框中输入几个单词那么简单了,不仅输入方式多样化(比如越来越流行的语音输入),并且还要在非常短的时间内给出一个精准而又全面的答案。目前,谷歌给出的解决方案就是—知识图谱(Knowledge Graph)。  相似文献   

一种互联网信息智能搜索新方法   总被引:10,自引:1,他引:9  
提出了一种互联网信息智能搜索新方法。该方法能够从组织结构和内容描述类似的同类网站中,准确有效搜索出隐藏于其内部的目标网页。为此它采用了将网页间相互关联特征与网页内容特征描述有机结合而形成的一种新的搜索知识表示方法。基于这种知识表示方法及其所表示的知识;该智能搜索方法不仅能够对风站中网页进行深度优先的智能搜索,而且还能够通过对其搜索过程和结果的自学习来获取更多更好的搜索知识。初步实验结果表明,这种智能搜索新方法在对同类型网站的目标网页搜索中具有很强的深度网页搜索能力。  相似文献   

随着互联网的迅速发展.网络上的信息量呈现出迅猛增长趋势,为了查询所需知识,搜索引擎已成为知识搜索和知识发现的必备工具。该工具是综合了数据库技术、数据挖掘技术、人工智能知识等多种技术,利用数据检索策略进行知识发现的过程。但目前搜索引擎还存在一些缺陷,尤其是针对个性化的查询请求往往不能达到满意效果。所以将数据挖掘技术应用到搜索引擎领域,从而产生智能搜索引擎,将会给用户提供一个高效、准确的Web检索工具。 本文针对目前搜索引擎在检索准确率和全面性方面存在的不足,设计并实现了一种智能化搜索引擎模型,同时提出了一种改进的聚类算法和关联分析方法,并在此基础上实现了一个基于数据挖掘的搜索模型。  相似文献   

互联网技术的发展,使得互联网上的信息量急剧增加,越来越多的网络用户依靠搜索引擎技术,从浩瀚的信息海洋中获取信息。使得搜索引擎蕴涵着巨大的商业价值,甚至出现了“搜索力经济”的说法,目前搜索引擎技术研究在国内外发展得非常迅速。本文详细介绍分析了在这一领域多种新技术。  相似文献   

1 前言随着互联网建设的不断发展,网站和网页数目都已经很难用Lawrence在Science和Nature给出的结论来估算。每个在网上冲浪的人都有体会,迷失在Internet浩瀚的资料中是多么容易。世界上最大的搜索引擎Google已经宣称搜索并索引了2,073,418,204张网页,在这近21亿索引并分类的网页中搜索,用户同样会迷失在层层链接之中。  相似文献   

针对用户利用常用搜索引擎查询信息时,搜索引擎返回海量杂乱、无序的网页,用户难以从中快速、准确地获得真正关心的信息的现状,从Internet用户的兴趣度出发,设计了一种基于近似网页聚类算法的智能搜索系统。该系统在用户利用常用搜索引擎系统进行信息检索时,消除搜索引擎返回的重复页,对剩余页面进行聚类,返回给用户聚类后的网页簇,这样用户就可以选择浏览自己感兴趣的页面,从而大大提高了信息检索的查准率;实验证明该系统在保证查全率和查准率的基础上大大提高了搜索效率。  相似文献   

互联网用户使用网络获取信息过程中,搜索引擎已成为必不可少的工具。传统的WWW搜索引擎是“提问——搜索”方式.对于所有用户给出同样的关键宇得到的检索结果都是一样的。本文基于传统搜索引擎Google的基础上,实现了个性化的搜索。论文重点阐述了基于向量空间模型的个性化搜索系统的设计和实现过程。系统返回结果能够根据不同用户的兴趣爱好给出用户满意度较好的结果。  相似文献   

搜索引擎并不真正搜索互联网,它搜索的实际上是预先整理好的网页索引数据库.因此网页索引库建立的好坏直接影响最后的查询结果的准确性和用户的查询速度.本文提出了一种建立倒排索引的算法并进行了分析和研究.  相似文献   

智能搜索引擎是结合了人工智能技术的新一代搜索引擎技术,除了能提供传统的快速内容检索、相关度排序等功能以外,还能提供用户角色识别、搜索内容的语义理解、用户兴趣鉴定、智能化过滤等强大功能。该文将提出了智能搜索引擎的特征、结构及实现技术,并给出了智能搜索引擎在企业人力资源管理决策支持系统中的应用,从而有效地弥补了综合性搜索引擎对企业人力资源决策支持系统中专门领域及特定主题信息覆盖率过低的缺陷。  相似文献   

一种WWW搜索引擎的设计与实现   总被引:2,自引:1,他引:2  
随着Internet在我国的迅速发展和WWW信息的不断增长,迫切需要开发中英文兼容的WWW搜索引擎来获得所需的信息。该文在分析WWW搜索引擎主要功能模块:信息采集模块、信息预处理模块和信息查询模块的基础上,提出采用人工智能搜索算法来遍历网页,对中英文网页进行自动的索引,并用向量空间的表示方法来表示网页内容和用户输入的查询表达式。实践证明,使用该搜索引擎,可以快速准确地搜索到用户所需的信息。  相似文献   

The Semantic Web (SW) is a meta-web built on the existing WWW to facilitate its access. SW expresses and exploits dependencies between web pages to yield focused search results. Manual annotation of web pages towards building a SW is hindered by at least two user dependent factors: users do not agree on an annotation standard, which can be used to extricate their pages inter-dependencies; and they are simply too lazy to use, undertake and maintain annotation of pages. In this paper, we present an alternative to exploit web pages dependencies: as users surf the net, they create a virtual surfing trail which can be shared with other users, this parallels social navigation for knowledge. We capture and use these trails to allow subsequent intelligent search of the web.People surfing the net with different interests and objectives do not leave similar and mutually beneficial trails. However, individuals in a given interest group produce trails that are of interest to the whole group. Moreover, special interest groups will be higher motivated than casual users to rate utility of pages they browse. In this paper, we introduce our system KAPUST1.2 (Keeper And Processor of User Surfing Trails). It captures user trails as they search the internet. It constructs a semantic web structure from the trails. The semantic web structure is expressed as a conceptual lattice guiding future searches. KAPUST is deployed as an E-learning software for an undergraduate class. First results indicated that indeed it is possible to process surfing trails into useful knowledge structures which can later be used to produce intelligent searching.  相似文献   

数据挖掘技术在Web预取中的应用研究   总被引:69,自引:0,他引:69  
WWW以其多媒体的传输及良好的交互性而倍受青睐,虽然近几年来网络速度得到了很大的提高,但是由于接入Internet的用户数量剧增以及Web服务和网络固有的延迟,使得网络越来越拥护,用户的服务质量得不到很好的保证。为此文中提出了一种智能Web预取技术,它能够加快用户浏览Web页面时获取页面的速度。该技术通过简化的WWW数据模型表示用户浏览器缓冲器中的数据,在此基础上利用数据挖掘技术挖掘用户的兴趣关联规则,存放在兴趣关联知识库中,作为对用户行为进行预测的依据。在用户端,智能代理负责用户兴趣的挖掘及基于兴趣关联知识库的Web预取,从而对用户实现透明的浏览器加速。  相似文献   

Recent research suggests that older Internet users seem to find it more difficult to locate navigation links than to find information content in web pages. One possibility is that older Internet users’ visual exploration of web pages is more linear in nature, even when this type of processing is not appropriate for the task. In the current study, the eye movements of young and older Internet users were recorded using an ecological version of the web pages or a discursive version designed to induce a linear exploration. The older adults found more targets when performing content-oriented compared to navigation-oriented searches, thus replicating previous results. Moreover, they performed less well than young people only when required to locate navigation links and tended to outperform the younger participants in content-oriented searches. Although the type of search task and type of web page resulted in different visual strategies, little or no support was found for the hypothesis that older participants explore web pages in a more linear way in cases where this strategy was not appropriate. The main conclusion is that differences in visual exploration do not seem to mediate the specific difficulty older adults experience in navigation-oriented searches in web pages.  相似文献   

随着互联网的普及和网页数量的飞速增长,搜索引擎已经成为从网上获取信息的首选工具.然而,目前主流的搜索引擎在响应用户提交的检索请求时,往往以较长的一维列表形式分页展示结果,为了找到自己所需要的信息,用户必须对该结果列表进行耐心的浏览.为了进一步提高用户获取信息的效率和质量,减轻用户的劳动强度,研究者提出了对检索结果进行再挖掘、再组织的问题,聚类就是其中的研究热点之一.本文在分析现有检索结果聚类算法存在的问题的基础上,提出了基于查询相关性分析的标签驱动聚类算法,该算法通过分析短语与查询项的关联程度,提取作为候选簇标签的短语,然后根据这些标签确定网页摘要隶属的候选簇,最后基于对候选簇和标签的评价进行簇筛选和归并,得到聚类结果及每个簇的标签.在相同环境下进行的对比实验表明,所提出的算法优于相关工作,而且需要更少的信息资源支持.  相似文献   

为了在Web环境中重用现有的基于MapObjects组件的代码资源,以IIS托管MapObjects应用的形式,提出了一种新的WebGIS解决方案:在.NET环境下基于MapObjects2.2 采用C#语言进行开发,由IIS托管的服务器端嵌入MapObjects组件以提供GIS功能服务,交互页面部分采用ASP.NET实现,页面元素与代码分离,结构清晰,安全性高;客户端无需下载、安装插件,借助通用浏览器即可访问WebGIS服务,提高了其可用性。并以此方案作为系统框架,基于该机制实现了网络版兰州城市交通电子地图,验证了该方案的可行性。
  相似文献   

In web browsers, a variety of anti-phishing tools and technologies are available to assist users to identify phishing attempts and potentially harmful pages. Such anti-phishing tools and technologies provide Internet users with essential information, such as warnings of spoofed pages. To determine how well users are able to recognise and identify phishing web pages with anti-phishing tools, we designed and conducted usability tests for two types of phishing-detection applications: blacklist-based and whitelist-based anti-phishing toolbars. The research results mainly indicate no significant performance differences between the application types. We also observed that, in many web browsing cases, a significant amount of useful and practical information for users is absent, such as information explaining professional web page security certificates. Such certificates are crucial in ensuring user privacy and protection. We also found other deficiencies in web identities in web pages and web browsers that present challenges to the design of anti-phishing toolbars. These challenges will require more professional, illustrative, instructional, and reliable information for users to facilitate user verification of the authenticity of web pages and their content.  相似文献   

基于Web挖掘的智能门户搜索引擎的研究   总被引:31,自引:0,他引:31  
搜索引擎是人们在Internet上快速获得信息的重要工具之一,但是由于中文自身的特点,使得检索结果的准确性和相关性不是很高,将Web挖掘技术应用到搜索引擎领域,从而产生智能搜索引擎,将会给用户提供一个高效、准确的Web检索工具。文章首先介绍了搜索引擎的工作原理和相关概念,然后介绍了Web挖掘的定义、分类和应用。最后,详细讨论了Web挖掘技术在智能搜索引擎的重要应用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号