共查询到20条相似文献,搜索用时 109 毫秒
1.
数据采掘与知识发现:回顾与展望 总被引:5,自引:0,他引:5
如何大规模数据库中发掘深层次的知识和信息,而不仅仅是那些从传统数据库查调方法所获得的平凡内容,这方面的研究正受到越来越多的关注。 相似文献
2.
3.
4.
5.
来自应用、社会、经济等各方面的迫切需求,以及不断升温的研究兴趣,使知识发现和数据采掘成为目前一个不断发展的领域。本文介绍了知识发现和数据采掘技术的产生背景、基本任务、方法及其应用,同时还简要介绍了目前已有的成熟的KDD系统及其将来的发展。 相似文献
6.
《计算机应用与软件》2016,(11)
随着我国民航业的迅猛发展,各大枢纽机场累积了海量的航班协同保障数据,挖掘其中潜在隐藏的知识具有重要意义。结合机场航班协同保障业务规则及航班协同保障数据的特征,利用关联规则挖掘技术,挖掘隐藏在航班协同保障数据中的知识,进而借助其优化航班保障流程,提升机场服务保障质量。通过实例验证,关联规则算法能够较好地发掘隐藏在航班协同保障数据中的潜在知识,将其应用于实际中能够为优化航班保障流程、提高航班准点率、提升机场服务保障能力提供有效的支撑和决策依据。 相似文献
7.
1 引言近年来,现实生活中数据量在高速增长,而在数据中发现有效知识的技术却相对匮乏,因此数据挖掘这一领域成为大家注目的焦点。对事务数据库进行分析的一个十分重要内容是关联规则的发现。此问题被Rakesh Agrawal等首先提出,尔后得到了广泛的研究,如文考虑了发现关联规则的效率问题,文考虑了增量发现问题,文考虑了在时间序数据库中发现周期性模式等等。但以上的工作都是将数据库看成是一个整体,没有考虑时间段的问题。最近,B.Oz-den等研究了发现“完全的”周期性关联规则的问 相似文献
8.
基于关联规则的空间数据知识发现及实现 总被引:4,自引:0,他引:4
空间数据挖掘就是从空间数据库中抽取隐含知识、空间关系及空间数据库中存储的其它模式的方法。空间关联规则是空间数据挖掘的一个重要表现形式,利用空间关联规则把空间数据库中的数据转化为知识是一个很好的方法。本文在分析空间关联规则的基础上,用基于关联规则的逐步求精挖掘算法,得出空间数据库中的知识,通过实例证明其方法的可行性。 相似文献
9.
国际知识发现与数据发掘工具评述 总被引:6,自引:0,他引:6
数据库中的知识发现是一个正在迅速局长的新兴领域,受到了学术研究界和企事业单位的广泛重视。在过去几年间,知识发现工具主要用于研究环境;而现在,复杂的工具产品正不断出现。在本文中,我们概述常见知识发现任务及其解决方法,并按照知识发现与数据发掘工具的一般特征、数据库连接性和数据发掘特征这三大项指标分析研究43种具有代表性的软件产品,这些产品有的是研究原型,有的是商品化的。最后,我们指出为了有效地满足用户需求,以及为了解决那些尚未解决或未充分解决的问题,知识发现软件所应该具有的重要特性。 相似文献
10.
11.
12.
韩燕 《数字社区&智能家居》2007,2(8):513-514
数据挖掘与知识发现是一个以数据库、人工智能、数理统计、可视化四大支柱技术为基础,多学科交叉、渗透、融合形成的新的交叉学科,其研究内容十分广泛。从数据挖掘与知识发现的概念开始入手,对数据挖掘技术常见的方法进行了分类讲解,同时比较了不同种方法之间的优缺点。 相似文献
13.
对于生物化工产品的工业生产而言,更要有合适的生产环境条件,然而由于生产过程的复杂性,确定适宜的生产环境较为困难。就生化企业生产的数据特征,提出了生产数据的指标分割预处理及针对稀有数据的关联规则挖掘方法,对数据指标分割的过程进行了详细的阐述,并针对稀有数据挖掘,提出了关联规则挖掘中相对支持度的概念,在此基础上设计并开发生化企业关联规则挖掘数据分析系统,给出了系统的结构和功能,并对系统应用进行了试验和分析,取得了较好的效果。 相似文献
14.
15.
一种改进的相联规则提取算法 总被引:3,自引:1,他引:3
相联规则的提取是数据挖掘的一个重要方面。Apriori算法是提取相联规则的经典算法,效率较高。AprioriPro算法是对Apriori算法的改进,它利用大项集生成过程中的中间结果对数据库进行过滤,从而加快候选项集的计数速度,提高了整个算法的效率。该文在AprioriPro算法的基础上,首先对其基本理论进行扩展并加以证明,提出了AprioriPro2算法。该算法相对于AprioriPro算法能更多地去掉数据库中的无效元组,从而进一步提高了算法的效率。 相似文献
16.
基于数据挖掘的知识发现在水电站优化调度中的应用研究 总被引:1,自引:0,他引:1
主要讨论基于数据挖掘技术的知识发现在水电调度系统中的应用,提出了基于数据挖掘的知识发现方法,建立了知识向量集的拓扑空间概念并提出了基于拓扑空间向量集的不确定性知识表示方法。 相似文献
17.
We propose an effcient approach for classifying insu±cient dataset with missing data (incomplete data) with group di?erence detection. Specifically, missing data in an insuffcient dataset are first completed with the parimputation strategy. And then, the insuffcient dataset is grouped by contrasting with a known dataset (transfer learning). Finally, for assessing the quality of the induced models, empirical likelihood (EL) inference is used to estimate the confidence intervals of structural differences between the insuffcient dataset and the known dataset. In such a way of mining, classifying incomplete data can be beneficial to industries as it will provide easier and smarter use of information. This will include evaluating a new medical product by detecting differences between the new product
and an old one for pharmaceutical companies and, identifying frauds by detecting abnormal operations. To experimentally illustrate the benefits, we evaluate the proposed approach using UCI datasets, and demonstrate that our method works much better than the boot-strap resampling method on, for example, distinguishing spam from non-spam emails; and the benign breast cancer from the malign one. 相似文献
18.
针对故障知识获取这一瓶颈难题,对基于数据挖掘的数据库技术去实现故障知识规则自动发现的方法进行了研究;在SQLSERVER 2005平台上,利用该平台提供的数据挖掘决策树算法,采用了将决策树算法与数据库系统的性能进行高效耦合的数据处理模式,建立了一种利用故障数据集自动获取故障知识规则的数据处理流程;最后利用转子故障实验获得的故障特征数据集进行的验证表明,该流程具有通过对故障数据集进行实时处理,自动建立起一种描述故障知识的决策树模型,并且通过对决策树枝进行结构元素的描述,可自动生成故障知识规则集合的功能;结果表明,SQL SERVER 2005数据挖掘平台提供的决策树算法,为基于故障数据资源的驱动挖掘出故障知识提供了一种新途径。 相似文献
19.
20.
李锂 《计算机与数字工程》2010,38(3):75-78
流程工业集成制造系统(CIMS)采用了BPS/MES/PCS三层体系结构。文章指出,现有的CIMS三层体系结构局限性已被明确提出,从而为此提出了一种基于数据挖掘和数据存储技术的新型数据平台。一个统一的数据平台是运用知识发现技术设计的,通过在生产和管理行为中管理企业的显式知识以及发现隐式知识。结果表明,文章提出的流程工业现代集成自动化系统在信息收集和知识共享方面拥有完整的结构。 相似文献