共查询到19条相似文献,搜索用时 46 毫秒
1.
数据开采研究的新领域 总被引:11,自引:3,他引:8
作为人工智能和数据库领域最富活力的研究方向,数据开采在传统应用领域已经取得了相当的成就。本文提出了目前数据开采新领域中有可能取得极大成就的四个方面:多媒体数据开采,在线式分析数据开采,WWW资源和WWW日志数据开采以及主动式数据开采。本文对这些领域进行数据开采的特点和关键做了详细的分析,并给出了一系列实施开采的措施和建议。 相似文献
2.
3.
基于网络环境的分布式KDD及Data Mining研究 总被引:4,自引:1,他引:4
本文针对KDD的研究现状及其面临的挑战,主要讨论了基于网络环境下,面向多个站点机,多种数据库、多类数据源的分布式KDD和Data Mining的整体方案和实验系统模型,研究内容包括高效分布式开采算法,KDD过程的无缝集成,KDD中的知识表示、知识更新以及开采结果可视化的有效方法等。 相似文献
4.
首先介绍了大型企业的数据开采系统的需求,从逻辑和物理上分布的数据到交互性所需的高性能,接着,论述了能够满足上述需求的软件体系结构。 相似文献
5.
一种快速有效的分布式开采多层关联规则的算法 总被引:6,自引:0,他引:6
关联规则(association rules)是数据开采的重要研究内容,建立项目的层次关系可以发现更加有意义的规则,主要研究分布式环境下开采多层关联规则的问题,提出了一种快速有效的MLFDM算法,采用的技术包括分布式编码交易表的有效修剪,侯选集的产生及修剪技术,侯选项集的全局支持数的计算方法等,论述了它的原理,具体实现方法及其几个改进算法,实验结果表明,算法MLFDM是有效的,并对MLFDM算法的几个变种进行了讨论。 相似文献
6.
半结构化数据的模式发现 总被引:7,自引:0,他引:7
半结构化数据指那些具有隐含结构或结构不严谨的数据,如何在这些数据上有效地找到有用信息,是知识发现领域的一个新课题。由于半结构化数据具有结构不规则的特性,从中抽取结构或发现模式就成为知识发现的的首要步骤。为了对该问题有一个较清晰的了解,本文综合了该领域的发展现状,将半结合化数据上的模式发现归为两类,数据模型和信息 取,并在每一类中展现了一些有代表性的应用。 相似文献
7.
本文讨论一种用模糊集合理论处理量化属性的方法,从而经关联规则的模糊开采方法,并对量化关联规则的开采查询语言作了说明。 相似文献
8.
本文在介绍数据开采基本知识的基础上提出了一个通用的开采机模型,并对其各模块的功能做出描述,针对目前许多开采大型数据库中的关联规则高效算法大多是在各自单独的领域内进行算法的理论研究与探讨的问题,本文在研究了两种高效的关联规则开采算法:最大频繁项目集算法FID(Frequent Itemsets Discovery),增量式更新算法IUA(Incremental Updating Algorithm)后,将以上算法综合并在计算机上实现,作为比较同时给出了Aprioiri(经典的关联规则开采算法)的实现。文中为了避免负面示例的问题,还引入了兴趣工的概念,并在系统中实现。 相似文献
9.
关联规则开采的集合算法 总被引:1,自引:0,他引:1
为了有效地从商业数据库中开采出有用的信息,需要解决的两个关键问题:(1)如何将现有的各种开采算法集成到DBMS(数据库管理系统)中去,(2)提高开采的效率,本文以关联规则开采为例,研究了上述问题,为了将关联规则开采算法与DBMS进行无缝集成,我们需要研制面向集合操作的集合算法,STEM是关联规则开采的经共集合算法,我们在分析了STEM算法性能以后提出了改进的SETM算法,为了提高开采的效率我们给出了并行开采算法PSETM*(Parallel SETM*),从算法比较中可以看出SETM*比SETM要高效。 相似文献
10.
11.
结合移动Agent应用开发方法,设计一个基于移动Agent的分布式计算应用模型.针对分布式数据计算现有方法,分析其不足,通过研究移动Agent体系结构及关键技术,从理论上探索将Agent技术与分布式数据挖掘相结合的可行性和技术优势,采用Agent技术解决分布式数据挖掘时所遇到的问题,全面、系统提出了解决方案.在此基础上,实现了一个Intranet环境下的基于移动Agent的分布式计算平台. 相似文献
12.
数据经常分布在不同的地方,需要的机器资源也随着数据量的增长按比例增长,但数据的增长往往快于机器资源和机器学习上的改进.描述了元学习的基本过程和几种组合元分类器的度量尺度.元学习能够改进可观测性和精度,但同时过度强大的元学习技术也会导致冗余,低效甚至不精确的元分类器层次.分析这些方法的局限性并且提出了基于相异性的裁剪算法,证实了元学习和相关的裁剪方法的组合能取得相似的甚至更好的表现. 相似文献
13.
14.
《计算机应用与软件》2014,(1)
对垂直分布于不同站点的数据进行联合关联规则挖掘是一个重要的研究方向,然而已有的算法挖掘得到的都是全局单维关联规则,不能处理多维数据集并得到全局多维关联规则。针对此问题提出一种数据两方垂直分布条件下的多维关联规则挖掘算法TDDM(Two Part Vertically Distributed Data Mining),该算法结合数据立方体技术,直接在垂直分布于两方的数据上进行挖掘,得到多维关联规则。理论分析和实验结果表明,该算法可以有效挖掘数据两方垂直分布条件下的多维关联规则。 相似文献
15.
关联规则挖掘算法FP-Growth虽然效率比Apriori要快一个数量级,但存在频繁模式树可能过大而内存无法容纳和数据挖掘过程串行处理等两大缺点。提出一种分布式并行关联规则挖掘算法,该算法针对分布式应用数据架构,不需要产生全局FPtree,避免全局FP-tree可能过大而内存无法容纳的问题,算法在各个主要步骤上都实现了并行处理。算法测试结果和分析表明,与传统的关联规则挖掘算法FP-Growth相比,该算法通过多节点分布式并行处理显著提高了执行效率和处理能力。 相似文献
16.
缓存技术在系统中的应用越来越广泛.主要对数据缓存进行研究,着重研究了分布式模式下的数据缓存技术.将数据缓存技术应用到社区平台的开发中,增加分布式解决方案.实验证明,分布式数据缓存技术能优化系统性能,提升数据访问效率. 相似文献
17.
18.
李留高 《计算机应用与软件》2010,27(10)
分布式数据库是数据在物理上分布而在逻辑上统一的数据库,如何维护其数据一致性是一个关键的技术问题.分析引起分布式数据库系统数据不一致的主要原因,研究分布式数据库数据一致性的基本原理,结合具体实例阐述基于ADO.Net实现分布式数据库系统数据一致性的有效方法. 相似文献
19.
可视化数据挖掘技术研究 总被引:6,自引:1,他引:6
总结了目前数据挖掘领域中可视化方法的研究状况。结合国外先进的数据挖掘工具,分析了当前可视化数据挖掘技术的应用现状。基于可视化数据挖掘的任务和目标,阐述了可视化数据挖掘技术的发展趋势。 相似文献