共查询到20条相似文献,搜索用时 62 毫秒
1.
2.
3.
4.
数据挖掘应用研究及展望 总被引:11,自引:0,他引:11
数据挖掘是一门应用性很强的要求。本文首先介绍了当前该领域内的主要研究成果,然后介绍了规范应用系统开发的标准,以及现有的一些挖掘工具。 相似文献
5.
6.
7.
8.
从数据挖掘到知识发现 总被引:1,自引:0,他引:1
<正> KDD简介 过去的十年里,生成和收集数据的能力迅猛发展。科学数据集、商品的条形码、商业的计算机化和政府事务等都产生了海量的数据。 如此大量的数据明显超出了传统手工数据分析方法的分析能力。这些方法能够从数据中产生信息报告,但不能分析这些报告的内容以便集中处理。这就要求新一代技术与工具具备智能地并且自动地帮助人们分析海量数据来获取有用知识的能力。 从原始数据中发现有用的模式(或知识)通常称之为数据库中的知识发现,简称KDD。这种称法出现于 相似文献
9.
10.
时态数据挖掘研究进展 总被引:12,自引:0,他引:12
Temporal data mining is one of the important braches of data mining.In this paper with the present documents first we systematically classify the present research on temporal data mining.Next,we give our generalizations and analyses to the main braches.Finally problems of the current research of temporal data mining are pointed out and solutions are prposed. 相似文献
11.
空间数据挖掘发展研究 总被引:8,自引:1,他引:8
空间数据挖掘是指对空间数据库中非显式存在的知识、空间关系或其它有意义的模式等的提取,在地理信息系统、地理市场、遥感、图像数据勘测、医学图像处理、导航、交通控制、环境研究等各种领域有着广泛的应用。该文从空间数据挖掘的定义、过程、特征和任务等方面对空间数据挖掘技术进行了研究,并介绍了一个空间数据挖掘原型—GeoMiner和未来的研究方向。 相似文献
12.
基于数据仓库的数据挖掘研究 总被引:3,自引:0,他引:3
结合当前数据仓库和数据挖掘的发展,本文探讨了数据仓库和数据挖掘结合的必然性;提出了基于数据仓库的数据挖掘的体系结构;综述了基于数据仓库的数据挖掘的主要特征和典型应用。 相似文献
13.
沈萍 《数字社区&智能家居》2009,(6)
数据挖掘是致力于数据分析和理解,揭示数据内部蕴藏知识的技术。它是未来信息技术应用的重要目标之一。而高维数据在实际应用中的使用,使得对高维数据挖掘的研究有着非常重要的意义。文章介绍了高维数据挖掘对数据挖掘的挑战及应对策略,提出了一些挖掘模型的创新点。 相似文献
14.
本文在介绍数据开采基本知识的基础上提出了一个通用的开采机模型,并对其各模块的功能做出描述,针对目前许多开采大型数据库中的关联规则高效算法大多是在各自单独的领域内进行算法的理论研究与探讨的问题,本文在研究了两种高效的关联规则开采算法:最大频繁项目集算法FID(Frequent Itemsets Discovery),增量式更新算法IUA(Incremental Updating Algorithm)后,将以上算法综合并在计算机上实现,作为比较同时给出了Aprioiri(经典的关联规则开采算法)的实现。文中为了避免负面示例的问题,还引入了兴趣工的概念,并在系统中实现。 相似文献
15.
17.
18.
19.
应用容错式挖掘,更多有用的信息可以从真实世界被噪音干扰的数据中获取.然而在过去相关的研究中,容错式频繁模式挖掘问题不是没有成熟的定义,就是将问题局限于仅找出允许固定错误数据项数的频繁模式.本文提出了比例性容错频繁模式挖掘的问题,并给出了两个实现算法:第一个算法称为FT-BottomUp,采用FT-Apriori定理找出允许所有可能错误数据项数的容错频繁模式;第二个算法FT-LevelWise,将所有的容错频繁模式按照它们所允许的错误数据项目数量分成多个群组,并分别挖掘出各个群组内的频繁模式. 相似文献
20.
本文通过数据挖掘自身的特点,有效地结合相关算法并基于人体运动捕捉数据,给出这两个问题的有效解决方法。主要工作如下:(1)提出了基于能量模型的算法。相对于现有文献中使用的关节的几何位置,本文提出了的人体能量模型能够有效地降低动作数据的维度,并且能够正确地反映原动作的特征。在此基础上,使用相关系数来表示人体运动过程中各关节之间的相关性,并据此提取出原动作的低维度索引,实验表明该索引能够有效地体现原动作的特征。使用支持向量机结合低维度索引可以有效地讲输入动作划分到一个动作大类中,在此基础上使用基于Keogh下界的线性索引算法可以精确、快速地检索到与输入动作DTW距离最近的候选动作。(2)提出了基于公共子序列距离的数据挖掘算法。相对于现有文献中使用的欧式距离,本文使用的基于最长公共子序列的度量方法能够有效地降低噪声对于挖掘结果的不利影响。使用启发式搜索可以将搜索所需要的时间降低为使用朴素式搜索算法的60%以下,并且随着序列的长度的增加、计算量的增大,前者相对于后者运行时间的百分比有明显的减小趋势,利用这一特性,该算法可以在长序列的主旨模式挖掘中,大规模地减少算法的运行时间。在各长度的候选模式集合中,使用层次化聚类分析可以有效地合并相似度较高的候选模式,以达到合理约简模式、消除相邻重叠模式对结果不利影响的目的。使用最小描述长度原则可以根据模式的长度以及出现频率对候选模式表达整个原序列的能力进行有效地评估,从而达到支持非固定长度主旨模式挖掘的目的。 相似文献