首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
数据挖掘分类算法综述   总被引:9,自引:0,他引:9  
基于数据挖掘分类算法的研究现状,对目前发展较成熟的几种分类算法如决策树、关联规则分类、神经网络、贝叶斯方法、遗传算法等数据挖掘分类算法分别进行了论述。主要分析比较各典型算法的优点和不足,对其他一些算法也作了简单介绍,旨在追溯算法的发展轨迹,指出部分算法可能发展的方向,为进一步研究提供有益的借鉴。  相似文献   

2.
随着科学技术的不断发展,特别是计算机技术和信息技术的不断发展,数据算法的重要性越来越明显,其中分类算法是数据挖掘技术中最为关键的一部分。接下来本文将结合笔者多年的研究经验,以目前计算机技术中最新的分类算法作为切入点,对相应的各种算法进行深入的比较和分析,并对各种算法的特性进行针对性的分析总结,从而对相关研究人员的研究提供相关的参考。  相似文献   

3.
一种集成数据挖掘的自动视频分类方法   总被引:1,自引:0,他引:1  
针对自动视频分类工作中分类预测精度低的问题,提出了一种集成数据挖掘技术的自动视频分类方法。首先进行视频分割,形成了一个视频属性数据库;然后分别使用决策树、分类关联规则等技术对视频属性数据库进行数据挖掘,提取出决策树分类规则集和分类关联规则集;最后利用一个规则集的合并裁减算法来合并这两个分类预测规则集,形成最终的具有更高精度的视频分类规则集。通过实验验证了决策树分类预测规则和分类关联规则具有分类预测的一致性;同时实验表明,使用合并后的规则集比单独使用一个规则集来预测视频具有更高的预测准确率。  相似文献   

4.
主要研究自动生成数据挖掘算法的解决方案.采用遗传算法对数据挖掘中的关联规则进行自动挖掘,提出一种基于遗传算法的关联规则自动提取算法,并结合电视购物项目,给出了该算法的实例验证.最后,通过与传统的Apriori算法比较,验证了该算法的高效性.  相似文献   

5.
并行数据挖掘研究   总被引:5,自引:0,他引:5  
张潇  恽爽  陆桑璐  陈道蓄 《计算机工程》2003,29(17):58-59,75
随着数据挖掘中数据量的高速增长以及大规模并行计算在数据挖掘中的应用,并行数据挖掘这一结合并行计算技术和数据挖掘技术在社会各个方面得到了大规模的各种各样的应用。然而,在数据挖掘并行化过程的同时,由于挖掘系统本身的原因,将挖掘过程完全并行还有一定的困难,这正是研究并行数据挖掘的价值所在。该文在分析并行挖掘现状,阐述并行挖掘技术发展前景的同时,针对并行挖掘的问题,指出了今后应该进行的工作。  相似文献   

6.
数据挖掘技术   总被引:4,自引:0,他引:4  
数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。本文简略介绍了数据挖掘的分析处理过程、分析处理模式、数据挖掘在电信企业中的应用以及数据挖掘的发展趋势。  相似文献   

7.
提出一种改进的数据挖掘算法。首先采用ICTCLAS系统进行文本预处理,以词频特征构建词条向量;然后融合词频特征和词频-逆向文件频率特征,构建训练样本集的特征矩阵;接着对该矩阵进行奇异值分解变换,得到语义空间,用于对文本特征向量进行语义空间变换,得到语义向量;最后构建联合支持向量机分类器,实现中文书目所对应的语义向量的自动分类。最后做了大量的仿真实验,实验结果表明,本文方法的分类准确率高于现有方法。  相似文献   

8.
杨光辉  封均康 《计算机仿真》2021,38(7):286-289,303
采用目前方法挖掘网络入侵数据时未考虑数据之间的关联规则,导致网络入侵数据挖掘过程的检测时间长、检测效率低、误报效率高.提出基于改进Apriori算法的网络入侵数据挖掘方法,利用改进后的Apriori算法产生网络入侵数据之间的关联规则,依据产生的关联规则对网络入侵数据进行特征抽取,最后将抽取出的特征放人贝叶斯数据分类器中...  相似文献   

9.
提出了一种基于数据挖掘技术的文献自动推荐系统架构,分析了系统实现的关键技术,并完成了系统模块化设计和算法实现。经实践验证,该推荐系统在特色资源库中具有良好的文献推荐效果和广阔的应用前景。  相似文献   

10.
为了克服传统数据挖掘算法与分布式数据挖掘算法的不足.提出了一种基于网格平台的数据挖掘算法,并改进了原有的Apriori算法,使其应用于网格平台。基于网格的数据挖掘算法具有合并计算力,安全,高效,节约硬件成本等优势已越来越受到学术界的重视。  相似文献   

11.
基于聚类和关联规则的挖掘算法   总被引:4,自引:0,他引:4       下载免费PDF全文
数据挖掘技术中关联规则可以很好地发现数据项之间存在的相互关系,同时有大量的挖掘算法可供选择。聚类分析就是通过分析数据库中的记录数据,根据一定的分类规则合理地划分记录集合,确定每个记录所在类别。它所采用的分类规则是由聚类分析工具决定的。本文研究 聚类和关联规则的挖掘算法。  相似文献   

12.
文中首先介绍了数据挖掘中关联规则的经典算法——Apriori算法。再从宽度、深度、划分、采样、增量式更新等几个角度对关联规则挖掘进行了分类讨论。然后运用文献查询和比较分析的方法对常见的关联规则挖掘算法进行了概述,主要包括FP—growth算法、DHP算法、Partition算法、FUP算法、CD算法等算法。最后对关联规则挖掘的发展远景进行了展望。  相似文献   

13.
根据关联规则挖掘的特点,提出了对遗传算法中适应度函数的构造,数据的编码等问题的改进方案,通过对"早熟"问题的分析,将改进的自适应交叉概率Pc和变异概率Pm算法应用到遗传算法中来。最后给出了一种基于遗传算法的关联规则挖掘算法,并应用到酒店信息管理系统中验证了算法的有效性。  相似文献   

14.
遗传算法在决策支持系统和数据挖掘中的应用   总被引:2,自引:0,他引:2  
决策支持系统和数据挖掘技术的应用已深入到企业管理、金融、办公及日常生活等各个领域。使用原先决策支持系统中的传统方法已远远不能满足决策者的需要,从而出现许多新技术新方法来辅助和完善决策支持过程。文中在介绍遗传算法的基础上,提出了一种将遗传算法与决策支持系统相结合的观点,阐述了基于遗传算法的决策支持系统的模型设计,且深入讨论了遗传进化技术在数据挖掘中的应用。  相似文献   

15.
模糊神经网络即具有输入信号是模糊量的神经网络,是模糊系统与神经网络相结合的产物,汇聚了二者的优点;遗传算法是一种自适应全局优化概率搜索算法.研究了基于模糊神经网络与遗传算法相融合的一种算法,在应用模糊神经网络进行数据挖掘前,应用遗传算法完成隶属函数的训练,以便更好地进行模糊神经网络学习;经过模糊神经网络学习后,提取相关规则,再次应用遗传算法,进行规则剪枝,提高数据挖掘效率.实验表明,与传统方法相比,该方法能够更快速、更加准确地进行数据挖掘,提取更精确的推理规则.  相似文献   

16.
王刚  王本年 《微机发展》2008,18(2):119-121
模糊神经网络即具有输入信号是模糊量的神经网络,是模糊系统与神经网络相结合的产物,汇聚了二者的优点;遗传算法是一种自适应全局优化概率搜索算法。研究了基于模糊神经网络与遗传算法相融合的一种算法,在应用模糊神经网络进行数据挖掘前,应用遗传算法完成隶属函数的训练,以便更好地进行模糊神经网络学习;经过模糊神经网络学习后,提取相关规则,再次应用遗传算法,进行规则剪枝,提高数据挖掘效率。实验表明,与传统方法相比,该方法能够更快速、更加准确地进行数据挖掘,提取更精确的推理规则。  相似文献   

17.
Understanding the Crucial Role of Attribute Interaction in Data Mining   总被引:6,自引:0,他引:6  
This is a review paper, whose goal is tosignificantly improve our understanding of thecrucial role of attribute interaction in datamining. The main contributions of this paperare as follows. Firstly, we show that theconcept of attribute interaction has a crucialrole across different kinds of problem in datamining, such as attribute construction, copingwith small disjuncts, induction of first-orderlogic rules, detection of Simpson's paradox,and finding several types of interesting rules.Hence, a better understanding of attributeinteraction can lead to a better understandingof the relationship between these kinds ofproblems, which are usually studied separatelyfrom each other. Secondly, we draw attention tothe fact that most rule induction algorithmsare based on a greedy search which does notcope well with the problem of attributeinteraction, and point out some alternativekinds of rule discovery methods which tend tocope better with this problem. Thirdly, wediscussed several algorithms and methods fordiscovering interesting knowledge that,implicitly or explicitly, are based on theconcept of attribute interaction.  相似文献   

18.
Our objective is a comparison of two data mining approaches to dealing with imbalanced data sets. The first approach is based on saving the original rule set, induced by the LEM2 (Learning from Example Module) algorithm, and changing the rule strength for all rules for the smaller class (concept) during classification. In the second approach, rule induction is split: the rule set for the larger class is induced by LEM2, while the rule set for the smaller class is induced by EXPLORE, another data mining algorithm. Results of our experiments show that both approaches increase the sensitivity compared to the original LEM2. However, the difference in performance of both approaches is statistically insignificant. Thus the appropriate approach for dealing with imbalanced data sets should be selected individually for a specific data set.  相似文献   

19.
分类规则可以挖掘出某些共同特性,是数据挖掘的重要方法之一。将贝叶斯理论应用于分类模式挖掘算法的设计中,可使分类的错误率最小,设计出更加完善的挖掘算法,从而提高数据挖掘的准确性和有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号