首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
数据挖掘在软件维护中的应用   总被引:2,自引:0,他引:2  
苏绍勇  潘金贵 《计算机科学》2005,32(10):245-248
软件维护是软件过程中十分重要但又难度较大的一个阶段,数据挖掘技术在软件维护中的应用大大改善了这一现状.本文从技术的适用性、一般应用步骤和主要应用领域等方面介绍了数据挖掘在软件维护中应用的发展历程,并在此基础上研究了所用到的关键技术及存在的问题.最后展望了未来的发展趋势.  相似文献   

2.
结合跆拳道技战术训练的需要,结合多媒体、数据库和数据挖掘等计算机技术,本文提出并实现一个跆拳道技战术信息数据采集与智能分析系统,较为详细地介绍系统实现的各种功能、使用的技术以及模块的设计实现。本系统将大大提高教练员工作效率,可以全面分析、掌握技战术资料,提高竞技水平。同时,由于在这些交叉新兴学科中,必然存在不少问题,本项目在最后也要进一步提出不足和改进措施。  相似文献   

3.
数据挖掘中的数据预处理模型与算法研究   总被引:10,自引:0,他引:10  
本文首先介绍了数据预处理的概念,然后将数据预处理无缝集成于数据仓库的构建过程中,提出了一种数据预处理过程模型。对于不同阶段所使用的数据预处理技术和算法,本文也进行了总结分析,并以粗糙集的属性约简为例给出了一种算法的具体实现步骤。  相似文献   

4.
医学数据挖掘中的数据预处理与Apriori算法改进   总被引:2,自引:0,他引:2  
医学数据挖掘是提高医院信息管理水平,为疾病的诊断和治疗提供科学的、准确的决策的需要。分析了医疗数据的特点,并以慢肺阻疾病诊断的数据集为例,阐述了把医疗数据转换成事务数据格式的方法,描述了关联规则挖掘在医疗数据分析中应用所遇到的难题,针对这些难题给出了一些算法的改进措施,并用数据进行测试。结果表明,此算法优于原来算法,它可以减少产生的规则的数量,从而能快速发现有趣的医疗关联规则。  相似文献   

5.
数据挖掘中的数据预处理   总被引:34,自引:0,他引:34  
1 引言数据挖掘(Data Mining,简称DM),也称为数据库中的知识发现KDD(Knowledge Discovery inDatabase),是近几年来随着数据库和人工智能发展起来的一门新兴的数据库技术。其处理对象是大量的日常业务数据,目的是为了从这些数据中抽取一些有价值的知识或信息。原始业务数据是知识和信息提取的源泉,对于数据挖掘就显得十分重要。目前所进行的关于数据挖掘的研究工作,大多着眼于数据挖掘算法的探讨,而忽视了对数据处理的研究。目前一些比较成  相似文献   

6.
王颖 《福建电脑》2007,(8):106-107
通过对数据挖掘技术的概念、挖掘过程和方法等知识的简单介绍,就如何在成绩分析系统中应用数据挖掘,从中得到促进教学的所需信息等内容进行了探讨,并提出了数据挖掘技术在各部分的具体作法.  相似文献   

7.
数据预处理是为考试分析系统提供高质量数据的关键。为了更好地从大量复杂的和不确定的考试数据中有效地挖掘有用的信息,必须对源数据进行预处理。本文通过对考试分析系统中数据源进行详细的分析,发现数据源具有不一致、冗余等特点。从而给出了考试分析系统中数据预处理的一般性方法。  相似文献   

8.
随着科学技术的不断创新发展,人工智能出现在大众视野,改变了人们的生活与工作方式。人工智能作为现代高端技术,经历了发展缓慢的低谷期,但现阶段人工智能的基础理论与实践应用已得到人们的普遍支持与认可。尽管人工智能的发展并不能完全归功于现代信息技术与大数据技术,但这两种技术切实为人工智能的发展与应用创造了更多的发展空间。由此可见,探究数据挖掘在人工智能中的应用意义不言而喻。  相似文献   

9.
叶玉萍 《福建电脑》2009,25(5):102-103
随着信息时代数据量的剧增,深化物流管理的最有效方法是在其中引入数据挖掘技术.充分合理的利用数据挖掘技术,可以进行市场预测和分析,这必将为正确的决策奠定坚实的基础。本文介绍数据挖掘技术的概念及方法.并结合物流企业的管理,阐述数据挖掘技术在物流企业中的具体应用。  相似文献   

10.
数据挖掘技术在互联网时代的应用   总被引:1,自引:0,他引:1  
广泛地从Web获取信息是信息时代的一个重要特征,借助数据挖掘的知识,从Web日志中发现用户的访问模式,可以帮助管理站点,更好地满足用户的要求,本文介绍了从原始的日志数据中发现用户访问模式的方法,提出了数据预处理的方法和一种新的用于挖掘的数据结构-序列访问树SAT,以及基于此结构的挖掘算法。  相似文献   

11.
介绍了数据挖掘的定义和常用方法,研究了基于遗传BP神经网络的数据挖掘算法,并对其交叉算子进行了改进,提高算法训练速度。实验结果表明,将该方法应用于油气识别中,效果良好,具有一定的实际应用价值。  相似文献   

12.
一种事务互补挖掘算法的研究及应用   总被引:2,自引:3,他引:2  
提出一种事务互补的挖掘算法,其适合挖掘任何长度的频繁项目集。该算法用事务互补搜索策略产生候选项,使用频繁项目集修剪其子集和非频繁项目集修剪其超集策略减少候选项;在计算支持数时使用了二进制的逻辑运算和事务特性,提高了算法的效率。将其应用到横向空间关联规则挖掘中,实验表明该算法是快速而有效的。  相似文献   

13.
基于SQL Server 2000下数据挖掘算法的研究   总被引:1,自引:0,他引:1  
微软的SQL Server2000是当今最流行的数据库管理软件之一,研究了在SQL Server 2000上数据挖掘实现方面的决策树算法.决策树算法通过构造精度高、小规模的决策树采掘训练集中的分类知识.SQL Server 2000/Analysis Service两层结构决策树,采用了以类记数表及深度优先策略生成,在建树算法和数据库间设立数据挖掘中间件.并讨论了通过使用像SQL Server 2000 Analysis Service这样的典型工具来如何实现数据挖掘模型的创建,且为商业组织的决定挖掘出必要的数据.  相似文献   

14.
多层关联规则挖掘算法的研究及应用   总被引:2,自引:0,他引:2  
针对商业银行业务系统中海量数据的分析和研究问题,提出了一种改进频繁项集挖掘算法FP-growth的多层关联规则数据挖掘算法.在对大量商业银行业务交易处理内在规律研究的基础上,依据利润度进行划分,使得该算法在满足用户需求的基础上,有效的缩小了层次结构树的规模,又加快了搜索的速度,从而提高了数据挖掘的效率.模拟算例表明,该算法有效可行,能够更好地适应商业银行交易系统层次结构在大型数据集的数据挖掘.  相似文献   

15.
数据挖掘在入侵检测系统中的应用研究   总被引:6,自引:0,他引:6  
洪飞龙  范俊波  贺达 《计算机应用》2004,24(12):82-83,87
指出了目前入侵检测系统中存在的问题,并由此提出一个基于数据挖掘技术的自适应入侵检测系统模型。文中详细阐述了其体系结构及主要功能,并通过具体的例子说明将数据挖掘技术应用于入侵检测是有效的。  相似文献   

16.
介绍了数据挖掘算法的两种传统数据访问方式及其缺点,提出了新的数据访问方式——基于Cache的数据挖掘算法的数据访问方法,该方法提供了三种模式缓存数据:单列模式、多列模式、混合模式,以适用多种数据挖掘算法的需要。设计实现了这种数据挖掘专用数据访问组件,该组件兼顾了传统访问方式的优点,实验证明在占用有限系统资源的情况下,保证了高效的数据访问效率并支持对海量数据的访问。  相似文献   

17.
潘定  沈钧毅 《控制与决策》2007,22(3):278-283
基于一阶线性时态逻辑。形式化定义时态数据挖掘中的主要概念。利用线性状态结构对每个时间点上的一阶语言符号进行赋值。并度量公式的真值范围.按照挖掘段概念.开发持续挖掘过程模型,用于归纳局部一阶规则与推导高阶规则.基于信息扩散原理.提出一阶规则的度量值估计方法和规则泛化算法.最后通过算例说明了扩散估计和算法的有效性.  相似文献   

18.
数据挖掘中聚类算法研究进展   总被引:6,自引:0,他引:6  
聚类分析是数据挖掘中重要的研究内容之一,对聚类准则进行了总结,对五类传统的聚类算法的研究现状和进展进行了较为全面的总结,就一些新的聚类算法进行了梳理,根据样本归属关系、样本数据预处理、样本的相似性度量、样本的更新策略、样本的高维性和与其他学科的融合等六个方面对聚类中近20多个新算法,如粒度聚类、不确定聚类、量子聚类、核聚类、谱聚类、聚类集成、概念聚类、球壳聚类、仿射聚类、数据流聚类等,分别进行了详细的概括。这对聚类是一个很好的总结,对聚类的发展具有积极意义。  相似文献   

19.
面向数据流的频繁项集挖掘研究   总被引:1,自引:0,他引:1       下载免费PDF全文
针对数据流的特点,对数据流中频繁模式挖掘问题进行了研究,提出了数据流频繁项集挖掘算法FP-SegCount。该算法将数据流分段并利用改进的FP-growth算法挖掘分段中的频繁项集。然后,利用Count Min Sketch进行项集计数。算法解决了压缩统计和计算快速高效的问题。通过和FP-DS算法的实验对比,FP-SegCount算法具有较好的时间效率。  相似文献   

20.
孟彩霞 《计算机应用研究》2009,26(11):4054-4056
数据流的无限性、高速性使得经典的频繁模式挖掘方法难以适用到数据流中。针对数据流的特点,对数据流中频繁模式挖掘问题进行了研究,提出了数据流频繁模式挖掘算法FP-SegCount。该算法将数据流分段并利用改进的FP-growth算法挖掘分段中的频繁项集,然后利用Count-Min Sketch进行项集计数。算法解决了压缩统计和计算快速高效的问题。通过实验分析,FP-SegCount算法是有效的。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号