共查询到20条相似文献,搜索用时 78 毫秒
1.
本文介绍了什么是KDD和Data Mining,目前国外在Data Mining中研究的一部分重要内容的概况以及几年来我们在KKD和Data Mining中的部分工作和看法。 相似文献
2.
3.
数据库技术和人工智能是计算机科学的两大重要领域。DB与AI的结合也是今后数据库技术的发展方向之一。本文首先简要讨论了DB与AI结合的方法,引出了KDD技术,并介绍了KDD技术的背景及现状。其次,讨论了当前高校科研管理对KDD技术的需求,以提高科研管理水平。最后,讨论了KDD技术在科研管理中的应用并给出了应用实例以及基于知识抽取的科研管理信息系统可能的体系结构。 相似文献
4.
一种基于密度和网格的聚类算法在KDD中的应用 总被引:1,自引:1,他引:1
聚类是数据挖掘领域中的一个重要研究方向。文章主要讨论数据挖掘中一种基于密度和网格的聚类算法的设计思想,并进行了编程实现,同时给出该算法在KDD(KnowledgeDiscoveryinDatabase)中的应用。 相似文献
5.
基于容错粗集理论的知识约简 总被引:1,自引:0,他引:1
粗集理论(RoughSetsTheory,RST)在处理不完全、不精确、不确定性智能信息问题等许多领域已取得成功的应用。然而RST理论还存在某些局限性,比如对等价关系的定义使得知识约简相对复杂化。该文提出利用容错粗集犤1犦RST的概念,建立属性值之间的容错关系,用容错关系对对象进行分类。该方法首先采用遗传算法求出属性阈值的最优组合,然后分别建立属性和对象的特殊矩阵,最后求出属性的相对约简和对象的相对商集。采用容错粗集进行知识约简减少了量化的过程,从而提高知识约简的有效性。该文最后提供了一个实例表明该方法是可行的。 相似文献
6.
介绍应用粗集理论和遗传算法相结合进行数据挖掘的方法.利用目前企业采集到的关键设备运行状态的大量数据,首先运用粗集理论的属性约简消去冗余的属性,然后以约简后的数据作为样本训练集,应用优化改进的遗传算法建立分类模型.根据构建的分类模型,可以发现故障设备运行的内在规律,快速对未知故障设备进行归类,从而为故障诊断与故障预测提供决策依据. 相似文献
7.
提出了一种基于神经网络和粗集的数据挖掘新方法。首先利用粗集理论对原始数据进行一致性属性约简,然后使用神经网络对数据进行学习,并同时完成属性的不一致约简,最后再由粗集对神经网络中的知识进行规则抽取。该方法充分融合了粗集理论强大的属性约简、规则生成能力和神经网络优良的分类、容错能力。实验表明,该方法快速有效,生成规则简单准确,具有良好的鲁棒性。 相似文献
8.
基于粗集理论和支持向量机的多源信息融合方法及应用 总被引:1,自引:0,他引:1
针对目前多源信息融合存在的问题,本文提出采用模拟人类思维的方法来实现信息融合.该方法首先利用粗集理论的强定性分析能力对多源输入信息进行约简,消除了样本中的噪声和冗余,在此基础上,再利用支持向量机对约简信息进行融合.为了获得最优的融合精度,该方法还利用遗传算法对融合进行了优化.文字识别的实例研究表明,该方法具有良好的容错性、稳健性和准确性. 相似文献
9.
10.
11.
空间数据采掘的研究与发展 总被引:19,自引:0,他引:19
数据采掘的研究已从关系型和事务型数据库扩展到空间数据库。空间数据采掘是一个很有发展的领域,它是在大量空间数据中进行知识发现的技术。文中总结了空间数据采掘领域中的研究成果,概括出空间数据采掘的体系结构、查询语言及相关方法,并探讨了目前存在的问题和发展方向。 相似文献
12.
CIMS中的数据挖掘是一个综合性的研究领域 ,它综合了先进制造技术、数据库技术、计算机网络和人工智能等诸多学科 .本文提出了采用以生物进化论为基础的遗传算法解决 CIMS中数据挖掘问题 .文章从辨证的角度出发 ,探讨了 CIMS中数据挖掘采用遗传算法解决知识发现的可行性以及其优越性 相似文献
13.
数据挖掘及其技术实现 总被引:4,自引:0,他引:4
数据挖掘解决在信息技术发展中存在的拥有大量数据但缺乏有用信息的问题,完成从业务数据到决策信息的转换。本论述了数据挖掘的概念及其工作流程,针对不同的功能类型对数据挖掘的技术实现进行了分析,并且阐明了数据挖掘设计和实现中的若干关键问题。 相似文献
14.
基于网络环境的分布式KDD及Data Mining研究 总被引:5,自引:1,他引:4
本文针对KDD的研究现状及其面临的挑战,主要讨论了基于网络环境下,面向多个站点机,多种数据库、多类数据源的分布式KDD和Data Mining的整体方案和实验系统模型,研究内容包括高效分布式开采算法,KDD过程的无缝集成,KDD中的知识表示、知识更新以及开采结果可视化的有效方法等。 相似文献
15.
动态数据挖掘过程中矛盾性知识的研究 总被引:1,自引:0,他引:1
目前知识发现领域中前沿的、棘手的但又是亟待解决的问题之一就是有关矛盾性知识的问题。本文在积累多年来对知识发现内在机理研究成果的基础上,进一步探求在动态大系统的知识发现过程中,矛盾性知识的概念模型及其突变规律,对当前主流的发展、解决KDD所面临的若干难题和挑战将具有一定的理论意义和实际意义。 相似文献
16.
数据仓库与数据挖掘研究进展 总被引:17,自引:0,他引:17
随着数据库应用从以事务处理为中心逐渐向以分析处理为中心转化,以数据仓库、联机分析和数据挖掘为中心的基于数据库的分析技术成为近几年来数据库界研究的热点。经过近十年的研究与应用。已经产生了很多的研究成果,建立了较扎实的理论基础,目前正在向与应用领域紧密结合(如流数据)。对现有技术进一步改造方面发展。本文对近两年这几个方向上的研究成果进行了总结。 相似文献
17.
信用卡作为一种特殊的金融商品,在中国市场中出现的历史并不长。本文主要讨论如何在信用卡一级代理过程中运用数据挖掘算法和技术对潜在客户进行分类,以便能在开展业务的过程中有所针对性。 相似文献
18.
图像数据挖掘研究综述 总被引:1,自引:0,他引:1
对数据挖掘中的一个新兴领域———图像数据挖掘作出了较为全面的研究。给出了图像数据挖掘的定义,分析了图像数据挖掘与图像处理分析、图像模式识别及图像检索等相关领域的异同点,并就图像数据挖掘对传统数据挖掘的改变和扩展之处作了较为详尽的阐述。从多个角度对图像数据挖掘进行了分类。介绍了关联规则、聚类、分类等技术在图像数据挖掘中的不同用法。最后,简单地介绍了图像数据挖掘的几个应用领域的研究现状。 相似文献
19.
数据挖掘技术在宝钢配矿系统中的应用 总被引:3,自引:0,他引:3
本文简要介绍了数据挖掘的概念和技术,并重点介绍了其在宝钢配矿系统中的应用。该配矿系统已创近6千万元的经济效益。本文最后对工业企业为解决生产实际问题应采用的主要的数据挖掘技术和步骤,提出了一个总结思路。 相似文献
20.
用数据采掘方法获取汉语词性标注规则 总被引:8,自引:0,他引:8
从数据采掘的角度对汉语文本词性标注规则的获取进行研究,在满足用户规定的支持度向量的前提下,先从侯选集模式中挑选出常用模式;然后采掘出具有高可信度的产生式规则。该过程完全是自动的,而获取的规则有表达上是明确的,同时又是隐含在数据中的、用户不易发现的,实验表明:在原有统计方法的基础上,利用自动获得的标注规则作为补充,可以提高词性标注的正确率。 相似文献