首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 453 毫秒
1.
提出了基于数据抽取器的知识发现模型。在模型中,将知识发现过程分成数据预处理、数据抽取、数据挖掘和结果分析四个阶段。该模型利用标准的SQL语言构造数据抽取器,为不同的学习算法准备数据,减少数据挖掘算法对数据库直接调用的次数,避免了直接对大型数据库的数据进行调用,使得对大型数据库进行快速数据挖掘成为可能。可以加快知识发现过程,提高数据挖掘效率,实现对于大型数据库的知识发现。最后设计了SQL-C4.5算法,该算法实现了利用数据抽取器为决策树算法C4.5抽取必要的统计数据,实现了C4.5决策树的构建。  相似文献   

2.
流数据挖掘综述   总被引:8,自引:1,他引:8  
作为一种新的数据形态,流数据对数据挖掘提出了诸多挑战。学者们已提出大量处理流数据的挖掘算法。本文对这些算法进行了综述。首先介绍了多个不同的数据流模型,这些模型对算法设计有着不同的要求。然后,总结了流数据挖掘算法的特点,并给出了算法中常用的技术。最后,分析了各个流数据挖掘任务中的代表性算法。  相似文献   

3.
基于OLAP的数据挖掘,是数据挖掘的一个新的发展方向。对于如何把OLAP(联机分析处理技术)和DM(数据挖掘)统一起来,从而在数据库或数据仓库的不同层次进行挖掘,提出了OLAP数据挖掘系统的结构。通过研究数据挖掘方法和OLAP操作的特点,以及数据立方的构建和物化,对传统的DM算法进行了改进,设计并实现了更能适应OLAP数据挖掘引擎的算法。  相似文献   

4.
数据挖掘:建模、算法、应用和系统   总被引:11,自引:3,他引:11  
数据挖掘是20世纪末逐渐形成的一个多学科交叉领域,目前已经广泛成功地应用在金融,零售、医药、通讯、电子工程、航空、旅馆等有大量数据和深度分析需求的领域。文中对数据挖掘的建模、算法、应用和软件工具进行了综述,给出了数据挖掘的定义、范畴和特点,以及数据挖掘的数据集的各种实际情况;总结了数据挖掘在实际应用时的基本步骤和过程;对数据挖掘在各种应用问题上的任务和建模进行了讨论;列举了目前数据挖掘领域中主要流行的算法,并对算法设计需要考虑的问题进行了简要的分析;综述了目前数据挖掘算法在一些领域的应用;较全面地叙述了目前数据挖掘软件工具性能及其开发商情况;最后,对数据挖掘的发展前景和方向进行了展望。  相似文献   

5.
一种时序数据的离群数据挖掘新算法   总被引:11,自引:0,他引:11  
离群数据挖掘是数据挖掘的重要内容,针对时序数据进行离群数据挖掘方法的研究。首先通过对时序数据进行离散傅立叶变换将其从时域空间变换到频域空间,将时序数据映射为多维空间的点,在此基础上,提出一种新的基于距离的离群数据挖掘算法。对某钢铁企业电力负荷时序数据进行仿真实验,结果表明了算法的有效性。  相似文献   

6.
数据预处理可以大大降低数据挖掘算法的成本和提高数据挖掘的效率,尤其对于海量和高维的基因表达数据更为重要。针对K-means算法对数据预处理手段敏感的问题,文章提出了一种以管家基因法初始化数据、Pearson系数度量芯片数据相似性的预处理方法。具体的实验数据证明了该方法能很好地解决上述问题并有效地提高k-means算法的收敛速度。  相似文献   

7.
一种改进的基于密度的离群数据挖掘算法   总被引:1,自引:1,他引:1  
利用基于密度的离群数据挖掘算法离群数据不在非离群数据指定的邻域内的特点,改进了原有的离群数据挖掘算法:首先判断数据是否在某个非离群数据指定的邻域内,如果不在,再判断其邻域内数据的个数。通过对二维空间数据测试表明,改进的算法能够快速有效地挖掘出数据集中的离群数据,速度上数倍于原来的算法。  相似文献   

8.
基于遗传算法的特征子集选择   总被引:15,自引:0,他引:15  
数据挖掘对象是大型数据库中的海量数据,而数据库中记录包含众多属性,由于其中存在的冗余和不相关属性降低了数据挖掘性能,增加了算法复杂性,因此,特征子集选择问题成为数据挖掘领域中的重要研究课题。该文根据过滤法思想,提出了基于遗传算法的特征子集选择算法,实验证明该算法获得了良好的收效性和稳定性。  相似文献   

9.
基于Web的数据挖掘算法与数据仓库的接口设计   总被引:6,自引:0,他引:6       下载免费PDF全文
提出了一种基于Web的数据挖掘系统中数据挖掘算法与数据仓库的接口设计方案,解决了算法与数据仓库的接口问题,实现用户通过Web浏览器动态调用算法,算法在Web环境下对数据仓库数据进行挖掘,发现有用的知识。该接口方案的通用性增强了数据挖掘系统的扩展性,有利于系统快速添加更多的新算法,以满足各种挖掘需求。  相似文献   

10.
一种带松弛因子的统计粗糙集挖掘算法   总被引:1,自引:0,他引:1  
刘发升  杨惠 《计算机应用》2004,24(8):61-62,68
针对实际应用领域数据挖掘的数据特征提出了基于底层数据信息归纳的带松弛因子的统计粗糙集数据挖掘算法DMSRIIR。该算法引进了保持原始底层数据信息的机制以及求近似约简的松弛因子,可以有效地避免生成规则的偶然性以及解决部分分类的问题。DMSRIIR还提供了应用粗糙集于实际数据挖掘的系统方法。实验表明了算法的可行性与有效性。  相似文献   

11.
信息化的到来导致数据急剧膨胀,从大量的数据中提取有用信息并非易事,数据挖掘就是为了满足这种需要而产生的。论文介绍了数据挖掘的相关理论知识和算法,算法有关联规则、遗传算法和决策树,对这些算法进行了分析研究,并找出其局限性。  相似文献   

12.
中药生产浓缩工段的模糊-智能PID控制研究   总被引:1,自引:0,他引:1  
中药生产浓缩工段难以精确建模,在传统模糊控制算法基础上,本文提出模糊-智能PID控制算法;在浓缩工段使用该算法,控制开关阀、调节阀动作从而完成对温度、压力、液位、pH值等参数的精确控制;以一效蒸发室温度θ为被控对象,分别用传统模糊算法和模糊-智能PID算法进行仿真,结果表明后一种算法使温度θ的上升速度更快、超调量更小、控制精度更高;当控制对象发生改变时,该算法的PID控制参数还具有自调整性,所以模糊-智能PID算法可用于控制浓缩工段的多种对象和过程.  相似文献   

13.
基于主机资源耗损分析防御DoS攻击的算法及实现   总被引:2,自引:0,他引:2  
王雅超  袁津生  马丽 《计算机工程与设计》2007,28(5):1043-1044,1157
随着计算机技术的迅速发展,DoS攻击成为主要的网络安全隐患.从分析主机资源耗损入手,提出了一种防御DoS攻击的一种算法.该算法通过分析系统CPU占用率来判断是否发生DoS攻击和进行DoS攻击的IP数据包,并进一步取缔非法占用的系统资源来保护主机能够正常工作.  相似文献   

14.
基于矩阵与图的关联规则挖掘   总被引:5,自引:0,他引:5  
提出了一种新的算法,该算法是在基于图的关联规则挖掘的基础上进行研究,并提出改进。该算法与传统的关联规则挖掘算法Apfiofi算法相比,具有一定的优势,如复杂度低,无需多次扫描数据库等。  相似文献   

15.
The authors consider the design of an LQG regulator, implemented in fixed-point arithmetic, which is optimized with respect to its state wordlength and structure. The approach extends previous design methods so that arithmetic errors are directly included. The optimal finite controller gains are computed as a function of the arithmetic wordlength subject to an l2-scaling constant on the controller states. The design method used permits the cost for the (near) optimal structure to be developed so that this can then be used as a basis for comparison to other less complex structures  相似文献   

16.
We present a heuristically certified form of floating-point arithmetic and its implementation in CoCoALib. This arithmetic is intended to act as a fast alternative to exact rational arithmetic, and is developed from the idea of paired floats expounded by Traverso and Zanoni (2002). As prerequisites we need a source of (pseudo-)random numbers, and an underlying floating-point arithmetic system where the user can set the precision. Twin-float arithmetic can be used only where the input data are exact, or can be obtained at high enough precision. Our arithmetic includes a total cancellation heuristic for sums and differences, and so can be used in classical algebraic algorithms such as Buchberger’s algorithm. We also present a (new) algorithm for recovering an exact rational value from a twin-float, so in some cases an exact answer can be obtained from an approximate computation.  相似文献   

17.
杨超  何静静 《计算机工程》2008,34(11):268-269
评价数据易被噪声污染,导致评价结论失真。该文提出一种基于数据密度的噪声清洗(DNC)算法,用于识别并过滤评价数据中的噪声,介绍了一套仿真实验方案。实验结果表明,DNC算法可以提高噪声的识别和过滤效果。该算法在数据管理领域具有应用价值。  相似文献   

18.
在线招投标系统中的加密和数字签名技术   总被引:2,自引:2,他引:2  
分析了在线招投标系统的基本过程和研究意义,给出了一种基于网上在线招投标系统的不可否认数字签名认证方案,使得可在不暴露用户安全信息的前提下实现其身份认证。方案包括了基于Rijndael算法的投标信息加密方法、基于SHA算法的投标信息数字摘要方法、基于RSA算法的数字摘要加密方法等,并对Rijndael算法、RSA算法的应用问题及系统的安全性进行了分析。实验结果表明了该方法的有效性。  相似文献   

19.
综合改进的粒子群神经网络算法   总被引:5,自引:0,他引:5  
粒子群优化算法是一种解决非线性、不可微和多峰值复杂优化问题的优秀算法,但该算法在进化后期容易出现速度变慢以及早熟的现象;BP神经网络的学习算法是基于梯度下降这一本质的,因此存在着容易陷于局部极小值,收敛速度慢,训练时间长等问题.针对上述现象,对粒子群优化算法进行了增强粒子多样性和避免种群陷入早熟两个方面的改进,并提出了一种基于改进算法的粒子群神经网络算法,最后通过在IRIS数据集上进行的仿真实验验证了改进的有效性.  相似文献   

20.
椭圆曲线加密算法及其在PKI中应用模型的研究   总被引:1,自引:0,他引:1  
对公钥基础设施(PKI)的关键技术进行了研究与分析,提出了一个基于椭圆曲线密码体制(ECC)的PKI模型,讨论了椭圆曲线加密算法的核心算法,并对算法提出了改进。比较了新旧两种算法的效率,得出了新算法更有效的结论,从而验证了这个PKI模型的可行性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号