首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
数据采掘与知识发现:回顾与展望   总被引:5,自引:0,他引:5  
如何大规模数据库中发掘深层次的知识和信息,而不仅仅是那些从传统数据库查调方法所获得的平凡内容,这方面的研究正受到越来越多的关注。  相似文献   

2.
数据采掘与知识发现:回顾和展望   总被引:20,自引:0,他引:20  
如何从大规模数据库中发掘深层次的知识和信息,而不仅仅是那些从传统数据 库查询方法所获得的平凡内容,这方面的研究正受到越来越多的关注.作为一门独立于应用 的研究课题,它已成为众多研究领域的热点内容,已经有相当多的应用报道并取得了丰硕的 成果.本文试就数据采掘和知识发现的各方面内容:如采掘过程、方法、算法和应用等,作 一个完整的回顾,文章也讨论了这一领域未来的工作和挑战.  相似文献   

3.
关联规则时间适用性及其发现方法   总被引:4,自引:0,他引:4  
提出关联规则的时间适用性概念、并用高频适用期和低频适用期来表示关联规则的时间适用性。在Apriori算法的基础上给出了发现关联规则时间适用性的算法描述。  相似文献   

4.
对演变数据进行关联规则挖掘的新方法   总被引:3,自引:0,他引:3  
齐雁  李石君  薛海峰 《计算机工程》2002,28(11):126-127,130
针对已有经常性周期关联规则在演变数据和周期长度方面的局限性,文章提出一种新的方法,从而可以对演变数据进行经常性长周期关联规则的挖掘,这种方法针对演变数据的动态环境,通过对数据块的动态聚类得到周期分段,然后在每一分段内利用低支持度关联规则挖掘算法来发现周期较长的关联规则,整个算法可以在GEMM算法的基础上进行动态模式保持。  相似文献   

5.
来自应用、社会、经济等各方面的迫切需求,以及不断升温的研究兴趣,使知识发现和数据采掘成为目前一个不断发展的领域。本文介绍了知识发现和数据采掘技术的产生背景、基本任务、方法及其应用,同时还简要介绍了目前已有的成熟的KDD系统及其将来的发展。  相似文献   

6.
随着我国民航业的迅猛发展,各大枢纽机场累积了海量的航班协同保障数据,挖掘其中潜在隐藏的知识具有重要意义。结合机场航班协同保障业务规则及航班协同保障数据的特征,利用关联规则挖掘技术,挖掘隐藏在航班协同保障数据中的知识,进而借助其优化航班保障流程,提升机场服务保障质量。通过实例验证,关联规则算法能够较好地发掘隐藏在航班协同保障数据中的潜在知识,将其应用于实际中能够为优化航班保障流程、提高航班准点率、提升机场服务保障能力提供有效的支撑和决策依据。  相似文献   

7.
1 引言近年来,现实生活中数据量在高速增长,而在数据中发现有效知识的技术却相对匮乏,因此数据挖掘这一领域成为大家注目的焦点。对事务数据库进行分析的一个十分重要内容是关联规则的发现。此问题被Rakesh Agrawal等首先提出,尔后得到了广泛的研究,如文考虑了发现关联规则的效率问题,文考虑了增量发现问题,文考虑了在时间序数据库中发现周期性模式等等。但以上的工作都是将数据库看成是一个整体,没有考虑时间段的问题。最近,B.Oz-den等研究了发现“完全的”周期性关联规则的问  相似文献   

8.
基于关联规则的空间数据知识发现及实现   总被引:4,自引:0,他引:4  
空间数据挖掘就是从空间数据库中抽取隐含知识、空间关系及空间数据库中存储的其它模式的方法。空间关联规则是空间数据挖掘的一个重要表现形式,利用空间关联规则把空间数据库中的数据转化为知识是一个很好的方法。本文在分析空间关联规则的基础上,用基于关联规则的逐步求精挖掘算法,得出空间数据库中的知识,通过实例证明其方法的可行性。  相似文献   

9.
国际知识发现与数据发掘工具评述   总被引:6,自引:0,他引:6  
数据库中的知识发现是一个正在迅速局长的新兴领域,受到了学术研究界和企事业单位的广泛重视。在过去几年间,知识发现工具主要用于研究环境;而现在,复杂的工具产品正不断出现。在本文中,我们概述常见知识发现任务及其解决方法,并按照知识发现与数据发掘工具的一般特征、数据库连接性和数据发掘特征这三大项指标分析研究43种具有代表性的软件产品,这些产品有的是研究原型,有的是商品化的。最后,我们指出为了有效地满足用户需求,以及为了解决那些尚未解决或未充分解决的问题,知识发现软件所应该具有的重要特性。  相似文献   

10.
数据采掘和基于数据库的知识发现是目前数据库研究界和产业界关济的热点。  相似文献   

11.
数据仓库与知识发现   总被引:7,自引:5,他引:7  
文章通过对数据仓库的概念以及基于数据仓库的知识发现系统的技术特点的介绍,揭示了基于数据仓库的知识发现应用的优势.  相似文献   

12.
数据挖掘与知识发现是一个以数据库、人工智能、数理统计、可视化四大支柱技术为基础,多学科交叉、渗透、融合形成的新的交叉学科,其研究内容十分广泛。从数据挖掘与知识发现的概念开始入手,对数据挖掘技术常见的方法进行了分类讲解,同时比较了不同种方法之间的优缺点。  相似文献   

13.
对于生物化工产品的工业生产而言,更要有合适的生产环境条件,然而由于生产过程的复杂性,确定适宜的生产环境较为困难。就生化企业生产的数据特征,提出了生产数据的指标分割预处理及针对稀有数据的关联规则挖掘方法,对数据指标分割的过程进行了详细的阐述,并针对稀有数据挖掘,提出了关联规则挖掘中相对支持度的概念,在此基础上设计并开发生化企业关联规则挖掘数据分析系统,给出了系统的结构和功能,并对系统应用进行了试验和分析,取得了较好的效果。  相似文献   

14.
关系数据库中知识发现的一种粒计算方法   总被引:1,自引:0,他引:1  
邱桃荣  刘清  黄厚宽 《自动化学报》2009,35(8):1071-1079
提出用粒计算方法从关系数据库或信息系统中挖掘具有不同粒度大小的多维多层次关联规则. 首先, 基于粒计算的划分模型给出了从关系数据库或信息系统中进行知识发现的框架; 其次, 提出频繁k-项目集生成的粒计算方法; 最后, 对所提出的粒计算方法通过实际例子进行说明, 并选择两类不同数据集在给定不同支持度下进行测试, 以及与两种经典方法进行了比较. 测试结果表明所提出的粒计算方法有效. 而且借助粒计算使得关联规则的语义变得更加清晰和易于理解.  相似文献   

15.
一种改进的相联规则提取算法   总被引:3,自引:1,他引:3  
相联规则的提取是数据挖掘的一个重要方面。Apriori算法是提取相联规则的经典算法,效率较高。AprioriPro算法是对Apriori算法的改进,它利用大项集生成过程中的中间结果对数据库进行过滤,从而加快候选项集的计数速度,提高了整个算法的效率。该文在AprioriPro算法的基础上,首先对其基本理论进行扩展并加以证明,提出了AprioriPro2算法。该算法相对于AprioriPro算法能更多地去掉数据库中的无效元组,从而进一步提高了算法的效率。  相似文献   

16.
基于数据挖掘的知识发现在水电站优化调度中的应用研究   总被引:1,自引:0,他引:1  
主要讨论基于数据挖掘技术的知识发现在水电调度系统中的应用,提出了基于数据挖掘的知识发现方法,建立了知识向量集的拓扑空间概念并提出了基于拓扑空间向量集的不确定性知识表示方法。  相似文献   

17.
We propose an effcient approach for classifying insu±cient dataset with missing data (incomplete data) with group di?erence detection. Specifically, missing data in an insuffcient dataset are first completed with the parimputation strategy. And then, the insuffcient dataset is grouped by contrasting with a known dataset (transfer learning). Finally, for assessing the quality of the induced models, empirical likelihood (EL) inference is used to estimate the confidence intervals of structural differences between the insuffcient dataset and the known dataset. In such a way of mining, classifying incomplete data can be beneficial to industries as it will provide easier and smarter use of information. This will include evaluating a new medical product by detecting differences between the new product and an old one for pharmaceutical companies and, identifying frauds by detecting abnormal operations. To experimentally illustrate the benefits, we evaluate the proposed approach using UCI datasets, and demonstrate that our method works much better than the boot-strap resampling method on, for example, distinguishing spam from non-spam emails; and the benign breast cancer from the malign one.  相似文献   

18.
针对故障知识获取这一瓶颈难题,对基于数据挖掘的数据库技术去实现故障知识规则自动发现的方法进行了研究;在SQLSERVER 2005平台上,利用该平台提供的数据挖掘决策树算法,采用了将决策树算法与数据库系统的性能进行高效耦合的数据处理模式,建立了一种利用故障数据集自动获取故障知识规则的数据处理流程;最后利用转子故障实验获得的故障特征数据集进行的验证表明,该流程具有通过对故障数据集进行实时处理,自动建立起一种描述故障知识的决策树模型,并且通过对决策树枝进行结构元素的描述,可自动生成故障知识规则集合的功能;结果表明,SQL SERVER 2005数据挖掘平台提供的决策树算法,为基于故障数据资源的驱动挖掘出故障知识提供了一种新途径。  相似文献   

19.
数据库中加权关联规则的发现   总被引:66,自引:0,他引:66  
关联规则发现是数据库中知识发现研究中的热点课题,有着广泛的应用领域.在现有的研究中,数据库中的各个项目是按平等一致的方式加以处理的.然而,在现实世界数据库中却并非如此,不同的项目往往有着不同的重要性.为了将它们反映出来,对项目引入权值,从而提出了新的加权关联规则问题.由于项目权值的引入,频繁项目集的子集不再一定是频繁的.为此,又提出了项目的k-支持期望概念,并由此提出了加权关联规则的发现算法.  相似文献   

20.
流程工业集成制造系统(CIMS)采用了BPS/MES/PCS三层体系结构。文章指出,现有的CIMS三层体系结构局限性已被明确提出,从而为此提出了一种基于数据挖掘和数据存储技术的新型数据平台。一个统一的数据平台是运用知识发现技术设计的,通过在生产和管理行为中管理企业的显式知识以及发现隐式知识。结果表明,文章提出的流程工业现代集成自动化系统在信息收集和知识共享方面拥有完整的结构。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号