共查询到20条相似文献,搜索用时 62 毫秒
1.
基于WWW的信息挖掘 总被引:3,自引:0,他引:3
本文介绍了信息挖掘的概念以及WWW和信息挖掘的商业意义,简要论述了基于WWW的信息挖拙的应用框架,并探讨了其应用、实现和进一步研究的方向。 相似文献
2.
面向主题的WWW信息挖掘系统 总被引:3,自引:0,他引:3
1 概述 WWW正以令人难以置信的速度飞速地发展,逐渐成为人们发布和获取信息的主要平台。虽然人们可以从WWW上获得大量信息,但由于WWW上的信息是无结构的、动态的、分散的,因此如何从WWW上高效地提取有用的信息仍是一个很有挑战性的课题。搜索引擎(如Excite、Google、Alta Vista)的广泛应用,使人们检索信息的效率大大提高。搜索引擎的工作原理是:由一个爬行器(Crawler)尽可能多地收 相似文献
3.
4.
Web数据挖掘系统的设计及实现研究 总被引:13,自引:4,他引:9
在全球信息化进程中,信息超载已经成为一个大问题。Web上信息虽多,但想找到需要的信息却很困难。人们通过点击和搜索引擎与Web进行交互,但是都不能从中准确快捷地获取需要的信息,Web数据挖掘技术就是解决此问题的好方法。讲述了Web数据挖掘的基本理论,根据挖掘对象的不同将其划分为Web内容挖掘、Web链接结构挖掘和Web访问信息挖掘;利用HTML网页的特殊结构性质,提出了一种Web数据挖掘系统的通用框架,并讨论了一些实现的具体技术。 相似文献
5.
基于Multi Agent技术的信息挖掘系统研究 总被引:10,自引:1,他引:10
信息挖掘技术是当代计算机研究领域的热门话题。本文将介绍当代社会信息挖掘的背景、分析WEB挖掘的内涵,并将把智能Agent和Multi Agent系统(MAS)引入信息挖掘领域,最后,结合实用软件Web Light阐述信息挖掘的智能过程作为全文总结。 相似文献
6.
WWW上的信息发现与搜索引擎技术 总被引:36,自引:1,他引:36
随着Internet在我国逐步得到普遍应用以及WWW上中文信息量的不断增长,迫切需要研制适合我国国情的中英文Web索引和检索服务系统。WWW的信息发现和搜索引擎又称robot负责搜索物获取指定范围内的有关数据。本文对Web搜索引擎的工作原理和关键技术进行讨论和分析,并分析了我们在研制中英文Web索引和检索服务器方面所做的工作,包括系统总体结构和汉语分词技术等。 相似文献
7.
Web用户访问模式挖掘研究 总被引:5,自引:0,他引:5
1 引言目前World Wide Web(WWW)已经发展成为拥有近亿个工作站、数十亿页面的分布式信息空间,在这个分布式信息空间中蕴涵着具有巨大潜在价值的知识,也带来了巨大的经济效益和社会效益。对于不同层次、不同使用目的和爱好的浏览者需要个性化的信息服务,希望网站能够根据自己的浏览习惯,动态定制 相似文献
8.
基于Agent技术的WWW信息查询系统设计 总被引:4,自引:1,他引:3
提出了一个基于Agent技术的WWW信息查询系统的设计方案,讨论如何把众多分散自治的信息Agent集成一体,以较好地解决WWW信息查询问题,对完成任务需要的信息Agent,根据其功能特点进行了适当的类型划分,分析研究了信息Agent的结构。 相似文献
9.
基于Internet的信息挖掘是数据挖掘技术中的重要组成部分,也是网络信息处理领域中的一项新课题。本文介绍了Internet上的电子文档信息自动挖掘的概念和系统的体系结构,并给出了文档结构图解析、文档分类检索等电子文档自动挖掘的预处理过程及处理程序。 相似文献
10.
WWW上Meta—Search的研究与实现 总被引:8,自引:0,他引:8
1 引言 World Wide Web是目前全球最大的信息系统,在WWW上查询Web文档主要依赖于Internet上的索引信息系统,如Yahoo、Infoseek、AltaVista、WebCrawler、Excite、Lycos等等。由于WWW太大又没有良好的结构且Web服务器的自治性,所以Web文档的查询难以做到全面而精确。衡量Web文档查询的质量主要有两个方面:①是否能把所有相关的文档资源找出来,不要有所遗漏。②尽可能保 相似文献
11.
12.
基于词典和遗传算法的文本特征获取方法 总被引:1,自引:0,他引:1
Web文本特征获取是Web挖掘中重要而关键的前提工作,传统文本特征获取方法由于在确定文本词条的权重方面做得不够准确,从而直接影响了文本分类算法的精确度.为此,提出一种基于主题词典和遗传算法的文本特征获取方法(dic.tionary and GA-based feature selection algorithms,DGFSA),利用主题词典来调整词条权重,从而获取文本特征向量.实验结果表明,DGFSA比传统算法在文本分类的准确率和特征词的约简率方面分别提高了28.4%和16.3%. 相似文献
13.
针对现有用户兴趣模型在模型建立以及更新阶段漂移策略的缺陷,设计了一种改进的基于隐式反馈的用户兴趣漂移方法.将用户兴趣分为长期兴趣和短期兴趣,对短期兴趣采用滑动窗口处理更新,对长期兴趣采用最近最少使用淘汰算法,并将该模型与遗忘策略模型、滑动时间窗口模型做了精确率的对比实验,实验结果显示该模型的性能优于其它三个模型. 相似文献
14.
15.
16.
WWW上基于内容的图象检索系统 总被引:2,自引:0,他引:2
基于内容的图象检索技术和网络技术的快速发展使得开发在线的图象检索系统成为可能。讨论WWW上基于内容图象检索系统的设计和实现要点,并详细介绍一个较为完整的WWW图象检索系统。 相似文献
17.
WWW浏览器插件开发技术 总被引:3,自引:0,他引:3
软件插件技术可以让软件的使用者自己动手来扩充或增强软件的功能,因此许多高水平的应用软件都提供了相应的软插件技术。主要介绍WWW浏览器(Netscape和IE)的软插件开发技术。 相似文献
18.
基于WWW多媒体远程教育系统的开发 总被引:1,自引:0,他引:1
计算机、网络和多媒体等技术的广泛应用,给教育界带来了前所未有的发展机遇,利用这些技术来发展远程教育已成为教育工作者的研究焦点.基于WWW多媒体远程教育系统是结合我校的实际情况,利用Web、数据库和多媒体等技术开发出来的系统. 相似文献
19.
20.
郑赞红 《计算机技术与发展》2003,13(Z2)
从现代远程教育的基本概念入手,阐述了现代远程教育系统的基本模式和构成,并分别讨论了基于Web和基于视频会议系统的远程教育系统的特点、组成和基本实现. 相似文献