首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
数据挖掘:建模、算法、应用和系统   总被引:6,自引:0,他引:6  
梁循 《微机发展》2006,16(1):1-4
数据挖掘是20世纪末逐渐形成的一个多学科交叉领域,目前已经广泛成功地应用在金融、零售、医药、通讯、电子工程、航空、旅馆等有大量数据和深度分析需求的领域。文中对数据挖掘的建模、算法、应用和软件工具进行了综述,给出了数据挖掘的定义、范畴和特点,以及数据挖掘的数据集的各种实际情况;总结了数据挖掘在实际应用时的基本步骤和过程;对数据挖掘在各种应用问题上的任务和建模进行了讨论;列举了目前数据挖掘领域中主要流行的算法,并对算法设计需要考虑的问题进行了简要的分析;综述了目前数据挖掘算法在一些领域的应用;较全面地叙述了目前数据挖掘软件工具性能及其开发商情况;最后,对数据挖掘的发展前景和方向进行了展望。  相似文献   

2.
数据挖掘:建模、算法、应用和系统   总被引:11,自引:3,他引:11  
数据挖掘是20世纪末逐渐形成的一个多学科交叉领域,目前已经广泛成功地应用在金融,零售、医药、通讯、电子工程、航空、旅馆等有大量数据和深度分析需求的领域。文中对数据挖掘的建模、算法、应用和软件工具进行了综述,给出了数据挖掘的定义、范畴和特点,以及数据挖掘的数据集的各种实际情况;总结了数据挖掘在实际应用时的基本步骤和过程;对数据挖掘在各种应用问题上的任务和建模进行了讨论;列举了目前数据挖掘领域中主要流行的算法,并对算法设计需要考虑的问题进行了简要的分析;综述了目前数据挖掘算法在一些领域的应用;较全面地叙述了目前数据挖掘软件工具性能及其开发商情况;最后,对数据挖掘的发展前景和方向进行了展望。  相似文献   

3.
随着医保领域业务的日益复杂化,对于医疗信息系统的建设提出了更高的要求。本文通过数据挖掘中聚类分析方法在医保系统中的应用研究,从海量的医保系统中提取出有用的信息,指导医疗系统中各个子系统的优化建设,同时分析出有价值的预测数据,推动医保业务的健康发展。  相似文献   

4.
研究探索了包括目标理解、准备数据、数据预处理、建立模型、评估解释、知识应用等水文数据挖掘的六个过程。并采用公共的数据处理和挖掘算法,实现各过程之间数据无缝连接,形成了松散耦合的水文数据挖掘系统体系框架。在实施水文数据挖掘过程中,将数据挖掘的一些数据处理方式应用到了水文领域,同时也采用了水文领域中的一些数据处理技术,实现了数据挖掘领域与专业领域的数据处理和评价方式融合。通过选取江苏省国家水文数据库中的两个不同代表性区域的水文资料,严格按照水文数据挖掘的过程控制,以水文相似年查找为突破口,实施数据挖掘。在全方位地对结果分析、对比和评价后发现,以数据挖掘的方法,采用聚类分析中分层聚类的凝聚算法,进行水文相似年查找所发现的结果与水文领域专家知识基本相符。  相似文献   

5.
农业信息系统的建立和大量农业数据的增长,人工获取知识和分析数据变得越来越难,需要对数据进行自动分析并获取知识。KDD和数据挖掘技术在农业中得到应用,由于农业领域本身的特点,通常的数据挖掘技术得不到有效应用。该文提出了几种对农业数据库进行知识发现的有效方法,并将知识发现方法与信息系统紧密结合。  相似文献   

6.
粗集理论能支持数据挖掘与知识发现的多个步骤,如数据预处理、数据简化、规则生成、数据依赖关系获取等,为数据挖掘与知识发现提供了新的思路和方法。本文将粗集理论引入空间数据挖掘领域,介绍了粗集理论的基础理论和一系列方法,给出了应用实例,并探讨粗集理论在空间数据挖掘中的应用。  相似文献   

7.
数据挖掘技术在农业数据中的有效应用   总被引:23,自引:0,他引:23  
农业信息系统的建立和大量农业数据的增长,人工获取知识和分析数据变得越来越难,需要对数据进行自动分析并获取知识。KDD和数据挖掘技术在农业中得到应用,由于农业领域本身的特点,通常的数据挖掘技术得不到有效应用。该文提出了几种对农业数据库进行知识发现的有效方法,并将知识发现方法与信息系统紧密结合。  相似文献   

8.
数据挖掘技术可以从大量的数据中发现某些有价值的知识.而将软件源码作为一种特殊的数据,在其上应用数据挖掘技术进行源码层次上的信息挖掘,已成为一个新颖而重要的课题.将对软件源码上的数据挖掘技术从各领域的应用、数据挖掘方法以及当前发展水平等主要方面展开介绍,并详细剖析当前此领域的制约因素,提出未来此领域的发展方向.  相似文献   

9.
数据挖掘和知识发现技术是当前数据库和信息决策领域最前沿研究的方向之一.在各个领域中的研究和应用越来越多,本文主要介绍了工程装备发展专家系统中应用数据挖掘和知识发现的几个方法,最后应用该技术对工程装备发展专家系统中的相关数据简单地进行分析.  相似文献   

10.
神经网络与非线性模式数据挖掘研究   总被引:3,自引:2,他引:1  
邓乾罡  孟波 《计算机工程与设计》2004,25(10):1667-1668,1694
论述了人工智能技术在数据挖掘领域应用的一些理论进展。非线性模式的规则提取是数据挖掘的一个主要任务,然而,目前有效的方法却很少。着重论述了一个专用于对非线性模式数据进行数据挖掘的模型,并且给出了简要的算法和一个例子。  相似文献   

11.
DNA序列数据挖掘技术   总被引:4,自引:1,他引:4  
朱扬勇  熊赟 《软件学报》2007,18(11):2766-2781
DNA序列数据是一类重要的生物数据.研究DNA序列数据解读其含义是后基因组时代的主要研究任务.数据挖掘是目前最有效的数据分析手段之一,用于发现大量数据所隐含的各种规律,也是生物信息学采用的主要数据分析技术.将数据挖掘技术用于DNA序列数据分析,已得到了广泛关注和快速发展,并取得了许多研究成果.综述了DNA序列数据挖掘领域的研究状况和进展,提出了3个研究阶段:基于统计的挖掘方法应用阶段、一般化挖掘方法应用阶段和专门的DNA序列数据挖掘方法设计阶段.阐述了DNA序列数据挖掘的基础是序列相似性,评述了DNA序列数据挖掘领域所采用的关键技术,包括DNA序列模式、关联、聚类、分类和异常挖掘等,分析讨论了其相应的生物应用背景和意义.最后给出DNA序列数据挖掘进一步研究的热点问题,包括DNA序列数据新的存储和索引机制的设计、根据生物领域知识的数据挖掘新模型和算法的设计等.  相似文献   

12.
基于知识网格的数据挖掘   总被引:8,自引:0,他引:8  
魏定国  彭宏 《计算机科学》2006,33(6):210-213
工业、科学、商务等领域的数据通常分布在不同的地方,需要在不同的地点对其进行分布式维护。只有使用计算功能超强的分布式、并行处理系统才能分析这些领域所产生的超大规模数据集。网格为分布式知识发现应用中的计算提供了有效支持。为了在网格上进行数据挖掘的开发,本文提供了一个称之为知识网格的系统,讨论如何应用知识网格设计实施数据挖掘应用,并说明如何搜索网格资源、编制软件和数据组件,以及数据挖掘应用在网格上的执行过程。  相似文献   

13.
基于领域本体的数据挖掘服务发现算法   总被引:3,自引:0,他引:3  
随着数据库的广泛应用,数据挖掘技术面临数据的海量化、分布化问题。采用面向服务的架构构造数据挖掘系统是解决该问题的方法之一。提出一种基于领域本体的数据挖掘服务发现算法,通过引入领域知识,定义数据挖掘本体,有效地解决了数据挖掘服务发现问题。首先给出了结合领域知识的数据挖掘服务发现框架,提出了数据挖掘方法本体和质量本体的定义,并给出了根据领域知识及用户需求进行数据挖掘服务发现的算法,为数据挖掘服务选择提供了较为完善的方案。  相似文献   

14.
数据挖掘方法本体研究   总被引:5,自引:0,他引:5  
数据挖掘是包含多个阶段的知识发现过程。一个简单、但典型的数据挖掘过程可能包括数据预处理阶段,数据挖掘算法的应用阶段,以及对挖掘结果的可视化处理阶段。在每个阶段,都会有多个算法或方法供数据挖掘工作者选择,但仅有一些算法和方法组合是有效的。即使是数据挖掘领域的专家,也可能会忽略一些重要的、有助于知识发现的数据挖掘算法或方法。本文中,我们将讨论使用本体的方法来协助数据挖掘工作者在实施数据挖掘过程中对众多可供选择的算法和方法进行选择。  相似文献   

15.
差分隐私保护及其应用   总被引:3,自引:0,他引:3  
数据发布与数据挖掘中的隐私保护问题是目前信息安全领域的一个研究热点.作为一种严格的和可证明的隐私定义,差分隐私近年来受到了极大关注并被广泛研究.文中分析了差分隐私保护模型相对于传统安全模型的优势,对差分隐私基础理论及其在数据发布与数据挖掘中的应用研究进行综述.在数据发布方面,介绍了各种交互式和非交互式的差分隐私保护发布方法,并着重从精确度和样本复杂度的角度对这些方法进行了比较.在数据挖掘方面,阐述了差分隐私保护数据挖掘算法在接口模式和完全访问模式下的实现方式,并对这些算法的执行性能进行了分析.最后,介绍了差分隐私保护在其它领域的应用,并展望未来的研究方向.  相似文献   

16.
数据挖掘取样方法研究   总被引:10,自引:0,他引:10  
取样是一种通用有效的近似技术.在数据挖掘研究中,取样方法可显著减小所处理数据集的规模,使得众多数据挖掘算法得以应用到大规模数据集以及数据流数据上.通过对应用于数据挖掘领域的代表性取样方法的比较研究和分析总结,提出了一个取样算法分类框架.在指出了均匀取样局限性的基础上阐述了某些应用场景中选用偏倚取样方法的必要性,综述了取样技术在数据挖掘领域的应用研究与应用发展,最后对数据流挖掘取样方法面临的挑战和发展方向进行了展望.  相似文献   

17.
取样方法这种有效的近似技术在现在的数据挖掘研究中能够最大限度的减小数据集的处理规模,将大规模数据集及数据流数据上以数据挖掘算法进行处理。取样法具有通用有效的特点。本文化通过对数据挖掘领域的取样方法分类以及影响取样方法选择的因素等问题进行分析研究,着重探讨了数据挖掘领域的代表性取样方选用以及应用发展。  相似文献   

18.
将粗糙集应用于数据挖掘领域,能提高对不完整数据进行分析和学习的能力,属性约简能删除冗余属性,提高系统潜在知识的清晰度,降低发现规则的时间复杂性。目前已在人工智能、知识发现、模式分类等方面得到了应用。文中描述了粗糙集的基本理论,并通过实例分析了粗糙集理论在知识约简中的应用。  相似文献   

19.
对随机投影算法的离群数据挖掘技术研究   总被引:1,自引:0,他引:1  
[d]维点集离群数据挖掘技术是目前数据挖掘领域的研究热点之一。当前基于距离或最近邻概念进行离群数据挖掘时,在高维数据情况下的挖掘效果不佳,鉴于此,将基于角度的离群因子应用到高维离群数据挖掘中,提出一种新的基于随机投影算法的离群数据挖掘方案,它只需要用接近线性时间的方法就能预测所有数据点的基于角度的离群因子。该方法可以用于并行环境进行并行加速。对近似质量进行了理论分析,以保证算法的可靠性。合成和真实数据集实验结果表明,对超高维数据集,该方法效率高、可伸缩性强。  相似文献   

20.
利用商务智能技术为医院医保业务的科学管理和决策提供支持。本文首先利用数据抽取、转换及装载工具获取有效数据,并通过建立多维模型和数据分析、数据挖掘方法生成各种分析、统计报表及图形。然后,建立智能的医院医保业务决策支持系统架构和数据仓库模型,并对医保病人的医疗费总额、药费比、自费比等进行多维度、多角度分析。结果表明,该智能系统在控制过度医疗、控制医保支出等方面提供了科学管理和决策依据。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号