排序方式: 共有128条查询结果,搜索用时 0 毫秒
71.
分布式数据库多层关联规则挖掘算法研究 总被引:1,自引:0,他引:1
对分布式数据库多层关联规则挖掘的理论和方法进行了研究,提出了一种基于频繁模式树FP-tree(Freguent Pattern tree)的快速挖掘算法DMAML_FPT(Distributed Mining Algorithm of Multiple Level based on FP-tree)。与类Apriori算法相比较,该算法最多只需扫描数据库三遍,不需产生和传输大量的候选项集,减少了数据通信量,从而提高了数据挖掘的效率。 实验结果表明算法DMAML_FPT是可行和有效的。 相似文献
72.
73.
交易数据库的加权关联规则增量更新算法 总被引:3,自引:3,他引:3
针对文献犤1犦提出的加权关联规则挖掘算法,文章提出了交易数据库的加权关联规则增量更新算法(DWARIUA算法)。该算法充分利用已存在的频繁项目集,因此,算法是有效而可行的。 相似文献
74.
时态数据库中增量关联规则的挖掘 总被引:6,自引:0,他引:6
时态数据库(temporal database)中的时态数据是数据信息中重要的一类,此类数据中存在着大量未知的涉及数据的变化趋势及数据增量之间相互关系方面的知识.给出了时态数据库中的相邻关系(adjacency)和增量(increment)的定义,提出了基于定量属性离散化及编码化的增量关联规则的基本模型(model of discretization & code-based increment association rules);并针对时态数据库中的属性大多为连续定量属性的特性,比较了"部分完备法"(partial completeness)、基于分类信息熵的离散化(entropy-based discretization)、C4.5、基于粗集理论的全局离散化(rough sets-based full discretization)及其改进等多种定量属性的离散化方法,结合定性属性的挖掘算法,提出了具有时间约束的增量关联规则挖掘算法TIDM;最后,讨论了互斥属性集的概念、基本特性及处理互斥属性集的基本方法,对于诸如企业风险管理的管理决策等应用是十分有意义的. 相似文献
75.
基于数据挖掘技术的保险业务风险分析 总被引:11,自引:0,他引:11
风险评估是保险公司的一项重要工作。目前保险公司对风险的分析通常是粗略的或根据经验来判断,提出利用数据挖掘技术对保险业务数据进行风险分析。在保险公司建立的保单及索赔信息数据库的基础上寻找索赔过和没有索赔的投保人各自具有的特征,从耍 现风险较大的领域,得到一些实用的控制风险的方法。 相似文献
76.
一种基于粗集理论的分类规则挖掘的实现方法 总被引:8,自引:0,他引:8
研究各种高性能和高可扩展性的分类算法是数据挖掘面临的主要问题之一。基于粗集理论的分类规则挖掘是一种重要的方法,在分析有关算法的基础上提出一种改进方法,并通过实例证明了该方法的效率有所提高。此外,还提出了一种分类规则约简方法,使挖掘的结果更简洁、更易理解。 相似文献
77.
应用主分量分析与粗糙集处理的特征提取 总被引:7,自引:1,他引:6
近年来,随着软计算理论的不断发展,粗糙集理论已经成为了目前研究的重点领域。论文讨论了主分量分析(PCA)与粗糙集的理论,并应用于图像特征提取中。采用PCA对输入向量进行甄别,应用粗糙集理论约简与分类无关或关系不大的向量。研究结果表明:在主成分分析中结合粗糙集理论可以排除无关向量的影响,并有效地进行特征提取。试验结果表明了结合两者能够提高模式分类的特征提取的效果。 相似文献
78.
一种基于最大加权频繁项目集的数据库相似性判别算法 总被引:1,自引:0,他引:1
在引入最大加权频繁项目集之后,给出一种新的数据库相似性度量模型,并提出基于最大加权频繁项目集的数据库相似性度量算法.该算法可有效地改进基于最大频繁项目集的数据库相似性度量方法,提高数据库相似性度量准确性.在实际应用中,改进模型为分布多库环境下数据挖掘的数据准备提供有效的框架,因而具有重要的使用价值. 相似文献
79.
本文针对电厂实时数据管理系统的应用需求,提出基于OPC技术实现电厂实时数据管理系统的总体结构;并以数据访问组件为例介绍了利用OPC技术实现发电厂实时数据管理组态平台DL-PASA-Real的方法。 相似文献
80.