共查询到19条相似文献,搜索用时 46 毫秒
1.
一个基于Web资源采样特征的元搜索引擎 总被引:1,自引:0,他引:1
随着Internet的快速发展,Web信息量急剧增加,Web信息检索也相应地越来越困难.本文提出利用查询采样、Web资源分类等技术,自动创建类似Yahoo!的分类层次资源特征,建立一个树型的Web资源特征检索系统.由于采样时只需采集同类信息的一部分,避免了全部采集带来的大量物力浪费.利用创建的资源特征,在检索时选择需要的资源.然后再利用互操作机制,远程调用该资源的全文索引机制进行检索,提高了检索的查全率和查准率.同时由于要检索的Web资源特征是通过选择相关和抛弃不太相关的Web资源,也提高了查询的效率. 相似文献
2.
以教师为评价对象,以科学的指标体系为评价因子,以学生、同行、领导、专家四种类型的用户为评价主体,采用软件工程的方法对系统进行分析、设计,采用ASP.NET技术开发了基于Web的授课质量评价系统.使用证明,系统具有实用性、高效性、科学性、灵活性和可靠性等特点. 相似文献
3.
数据预处理是Web日志挖掘中的关键和重要一步,文章分析了Web日志挖掘的数据预处理过程,并给出基于日志参引页的用户识别、路径补全算法和基于一种时间窗口模型的会话划分算法。 相似文献
4.
5.
为了提高网站的利用率及优化网站,构建了Web数据流挖掘系统,介绍了该系统的框架结构,并以商丘师范学院校园网为挖掘对象,说明了Web数据流挖掘的工作流程以及Web资源服务的具体实现流程。实践证明,基于Web数据流挖掘技术实现Web资源服务,可充分利用Web网站的信息和网络资源,实时、高效地为用户提供个性化的Web资源服务。 相似文献
6.
Web数据挖掘技术是近年来数据挖掘领域的研究重点之一。由于Web文档具有半结构化的特点,在执行具体的挖掘操作之前,对Web文档进行预处理是必不可少的。文章针对Web内容挖掘的预处理过程,提出一种以XML作为中介语言进行数据预处理的方法。 相似文献
7.
8.
基于Web的日志挖掘数据预处理方法的研究 总被引:22,自引:0,他引:22
随着www的广泛应用及相应的Web技术的出现,使数据挖掘的研究进入了一个新的阶段。Web日志挖掘就是运用数据挖掘的思想来对服务器日志进行分析处理。论文针对基于日志的数据挖掘提出了前期的几种数据预处理方法,目的是分割服务器日志为多个独一无二的用户的一次访问序列,并给予了很好的算法实现。 相似文献
9.
Web数据挖掘中的数据预处理 总被引:11,自引:0,他引:11
Web数据挖掘是分析网络应用的主要手段,其数据源一般是网络服务器日志,然而日志记录的是杂乱的,不完整的,不准确的并且是非结构化的数据,必须进行数据预处理。文章将预处理过程分为3个阶段-数据清洗、区分使用者,会话识别,并提出了一个高效的Web数据挖掘预处理结构WLP和相应的算法。 相似文献
10.
简单介绍了协同过滤推荐算法,提出了针对协同过滤算法的Web日志预处理过程;并对预处理过程的获取url集、兴趣评估进行了详细的探讨并提出自己的见解。 相似文献
11.
基于Web日志的数据预处理研究 总被引:2,自引:0,他引:2
详细介绍Web日志挖掘的数据预处理过程.通过对预处理的结果用户会话文件进行处理,构造出扩展有向树模型,并从每个用户会话文件中发现该用户所有的最大向前引用路径,为实施Web日志挖掘算法提供数据基础. 相似文献
12.
13.
基于用户访问树的Web日志挖掘数据预处理 总被引:1,自引:0,他引:1
在Web日志挖掘中数据预处理是整个挖掘过程的基础,直接影响日志挖掘的质量和结果.提出了一种基于用户访问树的Web日志挖掘数据预处理方法,该方法在处理过程中根据Web日志建立用户访问树,并利用用户访问树进行用户和事务识别,从而可以在缺乏网站拓扑结构的情况下准确地对Web日志进行预处理. 相似文献
14.
在日志数据的预处理中,确定合适的挖掘粒度是一项重要任务.本文介绍了一种日志数据预处理模型,在一般预处理模型基础上添加了页面视图识别环节,从而使日志数据有了更精确的挖掘粒度,挖掘结果有更强的语义. 相似文献
15.
使用联合链接相似度评估爬取Web资源 总被引:1,自引:0,他引:1
如何从Web上获取感兴趣的资源是许多Web研究领域重要的研究内容.目前针对特定领域Web资源的获取,主要采用聚焦爬行策略.但目前的聚焦爬行技术在同时解决高效率爬行和高质量的爬行结果等方面还存在许多问题.文中提出了一种基于联合链接相似度评估的爬行算法,该算法在评估链接的主题相似度时,联合使用了关于链接主题相似度的直接证据和间接证据.直接证据通过计算链接的锚链文本的主题相似度来获得,而间接证据则是通过一个基于Q学习的Web链接图增量学习算法获取.该算法首先利用聚焦爬行过程中得到的结果页面,建立起一个Web链接图.然后通过在线学习Web链接图,获取链接和链接主题相似度之间的映射关系.通过对链接进行多属性特征建模,使得链接评估器能够将当前链接映射到Web链接图的链接空间中,从而获得当前链接的近似主题相似度.在3个主题域上对该算法进行了实验,结果表明,该算法可以显著提高爬行结果的精度和召回率. 相似文献
16.
通过分析Web日志数据源的不准确性,提出了对Web日志数据源进行数据预处理的技术。结合实例详细介绍了数据净化、用户识别、会话识别、路径补充和事务识别等数据预处理技术。 相似文献
17.
数据预处理在Web日志挖掘过程中起着至关重要的作用。本文详细分析了数据预处理的过程,并对用户识别提出了改进策略,最后实现了一个Web日志挖掘预处理模型(WLMPM)。 相似文献
18.
19.