共查询到20条相似文献,搜索用时 0 毫秒
1.
随着时代的高速发展,我们日常生活中获得的信息急速增长,如何在这众多的信息中快速有效地找到我们需要的信息是越来越值得我们关注的问题。在高校图书馆中,我们就可应用数据挖掘的技术手段对图书馆中的文献系统产生的大量数据及WEB信息进行统计和分工,从而提高信息的利用效率额,为图书馆的使用者提供更高效、更高水平、更具信息时代特征及更为个性化的图书馆现代化信息服务。为此,本文就从数据挖掘技术的简要介绍出发,为学校图书馆应用wEB数据挖掘提出简要构象。 相似文献
2.
随着互联网的快速发展,Web数据挖掘已经成为当今热门的研究主题。本文介绍了Web数据挖掘的基本概念、Web数据的特点及其Web数据挖掘分类,并对Web数据挖掘技术的研究进行讨论。利用Apriori算法发现频繁集,找到页面间的关联规则。针对网页超链接结构的特点:一条超链接只能建立在两个网页上,发现频繁集只要找出所有2-项集即可,从而提出网页超链接挖掘的NApriori算法。NApriori算法显著提高了Apriori算法的效率。 相似文献
3.
传统的大数据聚类挖掘技术由于迭代次数过多,使其并行效率下降,为此,设计云环境下基于群智能算法的大数据聚类挖掘技术。在云环境下采用群智能算法初始化聚类中心,计算数据密度参数及类间距离,根据计算结果更新聚类中心,输出距离最小的最优解即为最优划分聚类,设计并行化聚类挖掘,以输出的最优解为依据,完成大数据聚类挖掘。实验结果表明,在数据集相同的情况下,与传统的两种聚类挖掘算法相比,文中设计的云环境下的群智能算法的大数据聚类挖掘算法随着迭代次数的增加,依然保持较高的并行效率,没有出现下降的趋势,说明该算法适合应用在实际项目中。 相似文献
4.
流程挖掘技术可以提取机场流程日志中的有用信息用于流程分析。但机场流程日志处于细节化的低抽象层次,不符合分析者的预期。对机场流程日志挖掘得到的流程模型呈现意面状的复杂结构,流程模型的含义难于理解。解决该问题的一种方法是通过活动挖掘,将低抽象层次活动聚类为流程模型中表征高抽象层次活动的活动类簇。为此提出了一种基于RankClus算法的活动挖掘方法,将机场流程日志的活动聚类与活动排序评分计算相结合,从而构建更易理解的活动聚类流程模型。实验结果表明,RankClus活动聚类流程模型的日志回放一致性与原生日志流程模型大致相当,但在结构复杂度上要显著低于原生日志流程模型。 相似文献
5.
Web数据挖掘技术研究 总被引:5,自引:0,他引:5
Web数据挖掘就是利用数据挖掘技术从网络文档和服务中发现和提取信息。Web数据挖掘是一种新兴的边缘科学技术,他涉及到机器学习、数据挖掘、信息检索、自然语言处理、数据库以及人工智能等技术,可用于网络检索、网站建设以及电子商务等方面。根据数据挖掘对象的不同可以将Web数据挖掘分为3类:Web内容挖掘、Web结构挖掘和Web访问信息挖掘。 相似文献
6.
基于多Agent的数据挖掘技术,不仅能够针对不同的Web数据综合采用不同的挖掘算法,而且可以在各站点进行并行挖掘,避免Web通信量过载。在简述Agent技术和Web数据挖掘技术的基础上,结合多Agent和Web数据挖掘,设计出一种新型数据挖掘模型,且进一步阐述了该模型,并做了一些分析测试。结果证明,该方法能有效提高Web数据挖掘的速度、准确率和覆盖率,提高了数据利用率。 相似文献
7.
随着网店的发展,分析客户的行为模式成为了网店发展状大的一种需要,在网络环境下,Web使用挖掘是一种进行客户分析的行之有效的方法。本论文通过分析Web使用挖掘的过程模型,研究了网店的Web使用挖掘对客户访问行为和购买行为的分析方法,从而明确Web使用挖掘在网店中的应用领域。 相似文献
8.
随着信息技术的发展,健康大数据呈指数级别剧增,但数据量过大使得较多有价值的数据被埋没,医疗服务的质量与效率难以提升。为解决上述问题,文中提出一种基于MapReduce的健康大数据并行挖掘算法。首先对健康大数据进行预处理,消除一些不利因素对数据的影响;再以预处理后的健康大数据为依据,获取初始簇中心,度量健康大数据与簇中心之间的距离,聚类处理健康大数据;最后,应用MapReduce制定健康大数据并行挖掘程序,执行制定程序即可完成健康大数据的并行挖掘。实验结果表明,所提算法的健康大数据挖掘效率最大值为94 GB/s,加速比最大值为4.5,相比于其他方法,该算法对健康大数据挖掘的性能更佳。 相似文献
9.
对Web日志中用户访问数据的挖掘可以很好的获得系统优化的信息,方便Web站点走向个性化、智能化道路。本文深入了解了Web日志格式的内容,研究了进行Web日志挖掘的一般流程。采取预处理的方式来获得用户有用信息,经过数据清理、用户识别、用户会话识别、界面过滤、路径补充来完成信息的有效汲取,最终通过模式发现和模式分析来完成对使用者感兴趣信息的传送工作,将Web日志挖掘技术真正应用在站点优化进程中。 相似文献
10.
介绍Web数据挖掘概念的分类、校园内网络化考试考前练习中的数据资源以及校园网络化考试考前练习中Web数据挖掘的主要过程.将传统的数据挖掘与Web结合起来进行Web数据挖掘,通过此系统,可以大大简化传统的考试过程.实践证明,通过对学生平时练习的Web数据进行挖掘分析,可以更合理地控制网络化考试试题的难易程度,有利于进行个性化辅导以及有利于管理员维护试题库. 相似文献
11.
12.
全巧梅 《信息技术与信息化》2012,(5):96-99,105
云计算是一种新兴的共享基础架构的方法,它以公开的标准和服务为基础,以互联网为中心,提供安全、快速、便捷的数据存储和网络计算服务。在云计算环境下进行Web数据挖掘的研究,可以为越来越多的海量数据挖掘提供解决方案。文章概述了云计算与Web数据挖掘的概念,描述了Web数据挖掘常用的算法,并提出云计算环境下改进的Web数据挖掘策略。 相似文献
13.
一致性检验作为流程挖掘中的一部分,不仅可以筛选可能存在问题的日志,还可以作为评价模型的一种方案,近些年来在研究和应用领域逐渐受到关注。发展至今,已相继提出了一致性检验中面向不同应用场景的各种算法。本文将从一致性检验算法、近似算法和在线算法三个角度对当前研究进展进行介绍,分析当前一致性检验算法的应用和发展前景。 相似文献
14.
15.
16.
17.
云计算是一种新兴的共享基础架构方法,它基于开放标准和服务,以互联网为中心,提供安全、快捷、方便的数据存储和网络计算服务.云计算环境下的数据挖掘的研究,可以提供更多和更大量的数据挖掘与解决方案.文章概述了云计算的概念和网络数据挖掘,涉及了常用的数据挖掘算法,以及运用云计算环境来提高Web数据挖掘策略. 相似文献
18.
数据信托作为一项突破性技术,为解决数据安全与管理的难题提供了全新的思路。目前世界范围内主要存在两种数据信托模式,分别是信息受托人模式和第三方信托模式,两种信托模式优势和劣势各有不同。我国通过学习数据信托方面的先进经验,也进行了一定的数据信托本土化的尝试,并且取得了一定成效。在此基础上,在推动数据要素市场化的环境背景下,通过对数据授权、数据要素流通、数据收益分配、数据安全等方面的分析,讨论数据信托如何推动数要素市场化。 相似文献
19.
Web数据挖掘研究与探讨 总被引:18,自引:0,他引:18
随着WWW迅猛发展,WWW上的信息量不断增加,如何在这些信息中找到用户真正需要的内容,成为数据组织和Web相关领域专家学者关注的焦点。由Web数据具有的半结构化特性,使得Web数据挖掘更加复杂,不同于传统的基于数据库的数据挖掘。为了解决这个问题,把数据挖掘的理论和技术应用于WWW,出现了一个新的研究领域——Web数据挖掘。基于Web的数据挖掘主要分为:Web内容挖掘、Web结构挖掘和Web使用记录的挖掘。综述了基于Web的数据挖掘技术概念与原理,并且介绍用以Web数据挖掘实现的一种全新的技术——XML。如何进一步开发Web数据挖掘,充分利用Web资源,还有待于进一步的研究。Web数据挖掘的研究具有极大的挑战性,同时又具有极大的开发潜力。 相似文献
20.
在众多不确定因素很强的数据中,如何挖掘数据是非常重要的,这时候关联规则挖掘理论就出现了.因此,在数据挖掘的领域中,关联规则有着突出的研究地位.本文从关联规则的产生背景和相关概念做出了论述. 相似文献