首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 562 毫秒
1.
语义搜索引擎概念模型   总被引:1,自引:0,他引:1  
语义搜索引擎作为未来的万维网搜索引擎,将不仅仅基于关键词检索,而是能够理解Web页面的内容,并进行逻辑推理来完成复杂的查询任务,最终返回精确的结果。对语义Web和搜索引擎技术进行了简要介绍,提出一种语义搜索引擎概念模型,并对其构成模块及模块问的互操作进行了描述,最后对概念模型具体实现上的关键技术进行了简要说明。  相似文献   

2.
基于Web的文本挖掘研究   总被引:10,自引:6,他引:4  
基于Web的文本挖掘是数据挖掘的重要组成部分,文章重点对文本特征提取、文本分类、文本聚类等Web文本挖掘关键实现技术做了介绍,最后讨论了Web文本挖掘的价值及其对Web发展的重要性。  相似文献   

3.
基于查询接口特征的Deep Web数据源自动分类   总被引:3,自引:0,他引:3  
搜索引擎可以很好地搜索出大部分可索引页面,然而,Internet上有大量的页面是由后台数据库动态产生的.传统的搜索引擎搜索不出这部分页面,我们称之为Deep Web。其中大部分Deep Web是结构化的,它提供结构化的查询接口和结构化的结果。把这些结构化的Deep Web数据源按所属领域进行组织可以方便用户浏览这些有价值的资源.并且这也是大规模Deep Web集成搜索的一个关键步骤。提出了一种基于查询接口特征的Deep Web数据源自动分类方法.并通过实验验证该方法是非常有效的。  相似文献   

4.
张敏 《信息技术》2006,30(6):143-145
Web上信息的不断增长对搜索引擎提出了更高的要求,个性化信息检索成为目前研究的一个热点。现提出了一个基于Agent的个性化信息检索系统模型PILLS,主要分析了系统的组成及各组成部分的工作原理。理论上,无论是查准率还是查全率,PILLS系统的查询结果优于一般搜索引擎的查询结果。  相似文献   

5.
Web垂直搜索引擎是一个复杂的信息系统,目前大多数研究都集中在解决搜索引擎中出现的某一个方面的问题,仍缺乏对Web垂直搜索引擎完整实现过程的相关研究。针对这个问题,提出一种三层架构的Web垂直搜索引擎的实现过程,整个过程包含数据准备、查询处理和界面交互。使用Java语言和相关的开源工具,对实现过程描述的具体任务进行实际操作,实现了一个查询手机信息的Web垂直搜索引擎。该三层架构和实现过程有效地为构建面向主题的完整Web垂直搜索引擎提供了理论依据和实践指导。  相似文献   

6.
基于BP神经网络的Web页面分类算法   总被引:3,自引:0,他引:3  
提出了一种基于BP神经网络的Web页面分类算法。在搜索引擎的结构中提取页面标题、内容标题和内容摘要来表示页面,采用向量空间模型计算分类组合与页面组合的相关性对页面进行矢量化,将训练后的BP神经网络用于对Web页面进行分类。实验结果表明,该分类算法有一定的实用价值。  相似文献   

7.
张智  顾韵华 《信息技术》2011,(5):108-111
针对Deep Web的查询需求,提出了一种基于K-近邻算法的Deep Web数据源的自动分类方法。该算法在对Deep Web网页进行表单特征提取及规范化的基础上,基于距离对Deep Web网页所属的目标主题进行判定。实验结果表明:基于K-近邻分类算法可以较有效地进行DeepWeb数据源的自动分类,并得到较高的查全率和查准率。  相似文献   

8.
刘启诚 《通信世界》2006,(12B):19-19
基于PC平台上的搜索商机造就了Google、百度两大中外互联网巨头,并且引来了微软、雅虎等众多企业的积极参与。而如今,这场搜索引擎大战目前正在从PC平台向WAP手机平台蔓延,再加上一些早就看好这块市场的移动增值服务商和新人“淘金者”,搜索引擎的重心正在逐渐从“Web”走向“WAP”。  相似文献   

9.
王聪  周沫 《信息通信》2013,(5):102-104
介绍了Web信息检索的概念以及其系统和Web信息检索的方法,在此基础上,针对搜索引擎在用户个性化服务上存在的问题,提出了一种基于多Agent的Web信息检索系统,通过对其运行机制的阐述论述了其可行性,并对Web信息检索技术研究方向进行了展望。  相似文献   

10.
针对高校的信息资源检索的命中率低问题提出了运用Web使用记录挖掘的高校图书馆搜索引擎。通过采用Web使用记录挖掘技术和Clementine对高校图书馆网站的Web访问日志记录进行挖掘。在Web使用记录挖掘流程中,提出一个基于用户IP、登陆时间、网站的拓扑图、引用网页和Agent来识别出单个用户的新算法,获得有效提高识别用户的实验结果。最后用路径分析来挖掘模式,优化网站结构,从而提高高校图书馆搜索引擎的命中率。  相似文献   

11.
基于DBP的Web用户行为分析关键技术   总被引:1,自引:1,他引:0  
文章针对Web用户行为分析所面临的"无规范、智能性差"问题,提出基于动态行为轮廓库(DBP)的行为分析方法,从数据净化、用户识别、事务识别、用户行为模式匹配几方面进行详细阐述,建立基于DBP的Web用户行为分析模型。首次提出基于DBP的Web用户行为分析关键技术,采用网站黄页法和逆向搜索引擎法构建DBP,通过实验验证,此方法很好解决了Web用户行为分类问题,能很好应用到Web用户行为分析领域。  相似文献   

12.
郑亦梁 《通讯世界》2016,(5):240-240
在网络信息时代下,搜索引擎是获取网络信息的检索媒介,但是,由于很多搜索引擎所提供的服务目前难以满足用户的实际使用之需,且检索效率与质量偏低。而在Web信息日益增加的背景下,其逐渐成为了目前用户借助互联网获取信息资源的主要途径,而要想满足当前用户对搜索引擎服务所曾提出的个性化需求,则就需要借助Web数据挖掘来实现其在个性化搜索引擎中的应用。本文针对Web数据挖掘与个性化搜索引擎进行了研究,以供参考。  相似文献   

13.
汤琛  王攀 《电信快报》2009,(12):42-45
网页自动分类是Web数据挖掘中的一个重要研究方向,也是搜索引擎前期的准备工作。文章介绍了一种利用搜索引擎原理构建从网页URL到行为类别映射关系的分类系统.该系统结合爬虫原理和网页自动分类技术实现了根据网页URL来判断用户行为的类别功能。实验表明该分类系统具有较高的分类质量和较强的适应能力。  相似文献   

14.
文中研究如何从HTML文档中提取图片相关信息,保证高效和准确的实现图片检索。在对图像搜索引擎检索模式分析的基础上,提出了若干关键技术,设计并实现了一个基于文本的Web图片搜索引擎,给出了系统的总体结构图.并对获取网页、提取信息、图片抓取、建立索引和提供查询进行了详细的描述,分析了图像搜索引擎的检索模式。  相似文献   

15.
随着移动互联网时代的到来,Web网站也随之正在发生巨大的变化,从最初的herf链接到Ajax动态加载页面内容到如今基于Java Script的MVC/MVVM框架的兴起,基于Web的网络爬虫也逐渐发生变化。本文主要研究如何抓取由Java Script动态生成的页面,从而使我们的搜索引擎更加强大,更加友好。  相似文献   

16.
Web2.0:互联网正在经历的进化   总被引:13,自引:0,他引:13  
目前互联网最热门的话题似乎都离不开Web 2.0的概念,无论是博客、RSS,WIKI、播客还是社会网络与互动社区。甚至搜索门户也在开发基于Web 2.0理念的新一代搜索引擎。Web 2.0这个概念从刚刚提出时倍受冷落到如今的红遍互联网,这个过程正如同人类的进化过程一样,每一次变革都要经历理论  相似文献   

17.
本文通过研究搜索引擎及搜索引擎营销的背景和发展现状优势及我国品牌网站的搜索引擎营销应用情况。从我国品牌网站的搜索引擎营销体系现状的分析中发现我国品牌网站的搜索引擎营销体系存在的问题,而后分析了搜索引擎优化(SEO)、PPC、Web分析和网站推广在企业电子商务网站营销中的作用,提出建立搜索引擎营销(SEM)体系策略,并针对现今搜索引擎营销还存在不足进行相应的改进。最后通过OPPO品牌网站利用搜索引擎进行营销成功案例分析,逐一论证了建立搜索引擎营销体系的重要性,从而得出品牌网站搜索引擎营销发展趋势和未来展望。  相似文献   

18.
Web数据挖掘研究与探讨   总被引:18,自引:0,他引:18  
随着WWW迅猛发展,WWW上的信息量不断增加,如何在这些信息中找到用户真正需要的内容,成为数据组织和Web相关领域专家学者关注的焦点。由Web数据具有的半结构化特性,使得Web数据挖掘更加复杂,不同于传统的基于数据库的数据挖掘。为了解决这个问题,把数据挖掘的理论和技术应用于WWW,出现了一个新的研究领域——Web数据挖掘。基于Web的数据挖掘主要分为:Web内容挖掘、Web结构挖掘和Web使用记录的挖掘。综述了基于Web的数据挖掘技术概念与原理,并且介绍用以Web数据挖掘实现的一种全新的技术——XML。如何进一步开发Web数据挖掘,充分利用Web资源,还有待于进一步的研究。Web数据挖掘的研究具有极大的挑战性,同时又具有极大的开发潜力。  相似文献   

19.
本文详细的介绍一种基于Web搜索引擎技术的网络敏感信息检索系统的设计与实现.基于搜索引擎技术的信息检索融合了文本挖掘的思想,它以一定的策略在WEB上搜集和发现信息,在对信息进行处理和组织后,结合本行业的特点,为特殊用户提供信息检索服务.  相似文献   

20.
以网络监督情报预警作为研究对象,提出并实现了基于XML的Web数据挖掘技术构建网络情报监督系统平台,该平台可以有效地从互联网上获取并分析相关舆情,达到预警和监督管理的目的.经系统性能分析表明其查准率高于通用搜索引擎.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号