首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
模糊聚类分析在数据挖掘中的应用研究   总被引:15,自引:0,他引:15  
数据挖掘是从大量数据中用平凡的方法发现有用的知识。聚类分析是数据挖掘的一个重要研究领域,它是按照一定的要求和规律将事物进行分类的一种数学方法。随着模糊数学的兴起,用精确的数学的方法研究模糊问题,人们逐渐将精确和模糊统一起来。论文将模糊数学的模糊理论应用于数据挖掘的聚类分析中,讨论了如何利用样本之间的模糊关系分析样本之间的关联程度,给出了模糊聚类分析在数据挖掘中的应用的主要步骤,以及相应的实例分析和程序设计。  相似文献   

2.
1 引言知识发现(Knowledge discovery in database,KDD)是应用一系列技术从大型数据库或数据仓库中提取隐含的、未知的、非平凡的对决策有潜在应用价值的知识和信息的过程,提取的知识表示为概念、规则、规律、模式等形式。知识发现过程一般由三个主要的阶段组成:数据准备,数据开采,结果表达和解释。知识发现的主要方法是数据总结、分类发现、聚类分析和关联规则的发现。其中分类是知识发现中非常重要的方法。现在从统计学和机器学习的角度提出了较多的分类技  相似文献   

3.
模糊聚类分析方法在DNA序列分类中的应用   总被引:3,自引:0,他引:3  
该文采用模糊聚类分析的方法对DNA序列进行分类.首先从DNA序列中单个碱基分布的“密度”角度出发,提取出DNA序列的特征,然后用模糊聚类分析中常用的方法对DNA序列进行分类.该文运用自行研制开发的集成11种模糊聚类分析算法的模糊聚类分析运算工具,首先对已知的1-20个DNA序列进行模糊聚类分析,根据分类结果的精度,找出了较优的6种聚类分析算法,然后用余下的21-40个DNA序列进行分类;最后,本文一次对所有的1-40个DNA序列进行归类,并综合了所有的分类结果,将难以归类的DNA序列进行了归类.分析结果表明,模糊聚类分析算法具有分类简单且分类结果精度较高的优点.  相似文献   

4.
知识发现技术能发现数据中有用的模式和知识,但如何和专家系统有效集成仍然尚未得到解决.本文从知识表示的角度探讨二者集成,提出一种面向知识发现的广义综合知识表示方法.该方法能有效表示包括关联、分类、序贯、神经网络、基于案例推理等在内的多种知识类型,同时该方法将知识发现方法表示在其内部,从而有利于自动知识获取的实现.在此基础上提出一种新型专家系统原型.该原型从语义、机制和接口三个层次集成知识发现技术,可以有效进行自动知识获取.  相似文献   

5.
基于PCA与ICA特征提取的入侵检测集成分类系统   总被引:10,自引:0,他引:10  
入侵检测系统不仅要具备良好的入侵检测性能,同时对新的入侵行为要有良好的增量式学习能力.提出了一种入侵检测集成分类系统,将主成分分析(PCA)和独立成分分析(ICA)与增量式支持向量机分类算法相结合构造两个子分类器,采用集成技术对子分类器进行集成.系统利用支持向量集合对已有的入侵知识进行压缩表示,并采用遗传算法自适应地调整集成分类系统的权重.数值实验表明:集成分类系统通过自适应训练权重,综合了两种特征提取子分类器的优点,具有更好的综合性能.  相似文献   

6.
联合挖掘发现网络安全事件   总被引:2,自引:0,他引:2       下载免费PDF全文
针对关联规则Apriori算法在实际应用中存在一些缺陷,本文在分析聚类分析和关联规则这两种挖掘算法的基础上,结合网络安全事件的特点,讨论了将这两种独立的挖掘方法集成起来的联合挖掘应用于安全事件发现中。  相似文献   

7.
遥感影像分类一直是遥感领域的研究热点.集成学习通过多个单一分类器得到的分类信息进行综合来提高分类的精度.论文阐述了集成技术的常用算法和策略,给出了遥感数据分类采用单分类算法,Bagging,Boosting以及MCS集成分类的实验结果的比较和分析.实验表明,集成技术能有效提高遥感数据的分类精度.在训练样木少的情况下,提供了一种保证分类性能和泛化性的有效途径.  相似文献   

8.
随着网络的迅速发展,网络上的信息越来越丰富,如何发现潜在的有用知识将成为今后发展的方向。本文在分析了向量表示法的弊端之后,提出了利用文件指纹对Web文本进行分类的方法,然后再利用k-means算法对所分类文本进行聚类分析,得到所需结果。通过文本挖掘模型,建立起可操作性的挖掘方法。  相似文献   

9.
聚类后的关联规则快速更新算法研究   总被引:1,自引:0,他引:1  
关联规则和聚类分析是数据挖掘中重要的研究课题。通过对关联规则挖掘算法Apriori算法进行分析与研究,指出了其在实用中存在的两个主要问题。鉴于此,在分析聚类分析和关联规则两种挖掘算法的基础上,讨论了将这两种独立的挖掘方法集成起来的联合挖掘,使其可以有效地压缩数据规模。给出了聚类后的关联规则快速更新算法描述。实验结果表明,算法性能优良,提高了数据挖掘执行效率。  相似文献   

10.
聚类分析是数据挖掘技术中的一种重要的分类方法,有着广泛的实际应用。现实的分类问题往往伴有模糊性,对具有相似关系的元素进行分类,需要将相似矩阵改造为等价矩阵。而要将相似矩阵改造为等价矩阵,只需要求相似矩阵的传递闭包。文章将模糊聚类分析传递闭包方法应用于生物种群遗传分化的研究,进行了实例分析,给出了模糊聚类分析传递闭包方法的实现过程和聚类分析结果。  相似文献   

11.
基于粗糙集的决策规则约简   总被引:4,自引:1,他引:4  
粗糙集理论是一个新的数据挖掘方法,正越来越被人们所重视。其主要思想是保持分类能力不变的情况下,利用等价类,通过属性约简和决策规则约简,达到发掘知识并简化知识的目的。但是属性约简是一个NP问题,对属性的约简和决策规则的约简只能通过启发式算法实现。该文针对属性约简和决策规则约简,各提出了一个启发式算法。  相似文献   

12.
.数据挖掘是信息技术自然演化的结果,使用数据挖掘工具进行数据分析可以方便的获得重要的知识并应用于决策,提出一种基于本体的数据挖掘算法,讨论使用本体的方法来协助数据挖掘.  相似文献   

13.
钟智  尹云飞 《计算机工程》2005,31(23):76-78
提出了3种实用的软件数据挖掘方法:评价指标法,中心知识法,偏离度法。介绍了这3种常用软件数据挖掘的概念,给出了它们的具体模型,最后对这3种软件数据挖掘方法进行了比较和评价。  相似文献   

14.
粗集理论能支持数据挖掘与知识发现的多个步骤,如数据预处理、数据简化、规则生成、数据依赖关系获取等,为数据挖掘与知识发现提供了新的思路和方法。本文将粗集理论引入空间数据挖掘领域,介绍了粗集理论的基础理论和一系列方法,给出了应用实例,并探讨粗集理论在空间数据挖掘中的应用。  相似文献   

15.
该文在以基因本体论GO(Gene Ontology,GO)为例考察生物领域知识对基于机器学习的基因挖掘方法的影响。通过基因芯片表返谱数据实验,考察几种基因挖掘方法用与不用GO信息的效果,结果表明利用GO信息,基因挖掘方法都能得到改善。  相似文献   

16.
The first part of this paper served as a comprehensive survey of data mining methods that have been used to extract knowledge from solutions generated during multi-objective optimization. The current paper addresses three major shortcomings of existing methods, namely, lack of interactiveness in the objective space, inability to handle discrete variables and inability to generate explicit knowledge. Four data mining methods are developed that can discover knowledge in the decision space and visualize it in the objective space. These methods are (i) sequential pattern mining, (ii) clustering-based classification trees, (iii) hybrid learning, and (iv) flexible pattern mining. Each method uses a unique learning strategy to generate explicit knowledge in the form of patterns, decision rules and unsupervised rules. The methods are also capable of taking the decision maker’s preferences into account to generate knowledge unique to preferred regions of the objective space. Three realistic production systems involving different types of discrete variables are chosen as application studies. A multi-objective optimization problem is formulated for each system and solved using NSGA-II to generate the optimization datasets. Next, all four methods are applied to each dataset. In each application, the methods discover similar knowledge for specified regions of the objective space. Overall, the unsupervised rules generated by flexible pattern mining are found to be the most consistent, whereas the supervised rules from classification trees are the most sensitive to user-preferences.  相似文献   

17.
Numerous studies on bankruptcy prediction have widely applied data mining techniques to finding out the useful knowledge automatically from financial databases, while few studies have proposed qualitative data mining approaches capable of eliciting and representing experts' problem-solving knowledge from experts' qualitative decisions. In an actual risk assessment process, the discovery of bankruptcy prediction knowledge from experts is still regarded as an important task because experts' predictions depend on their subjectivity. This paper proposes a genetic algorithm-based data mining method for discovering bankruptcy decision rules from experts' qualitative decisions. The results of the experiment show that the genetic algorithm generates the rules which have the higher accuracy and larger coverage than inductive learning methods and neural networks. They also indicate that considerable agreement is achieved between the GA method and experts' problem-solving knowledge. This means that the proposed method is a suitable tool for eliciting and representing experts' decision rules and thus it provides effective decision supports for solving bankruptcy prediction problems.  相似文献   

18.
链接预测是知识图谱的补全和分析的基础。由于位置相关的实体和关系本身拥有丰富的位置特征,该文提出了一种基于位置的知识图谱链接预测方法。该方法首先通过分析实体和关系的语义特征对关系进行分类,然后提出了一种基于位置的实体和关系位置特征和规则的挖掘方法;其次,通过挖掘出的实体位置特征和规则,对实体和关系的向量化方法预测结果进行约束,得到最终的结果。该文通过对WikiData、FB和WN数据集的实验,证明该方法针对基于位置的关系和实体链接预测拥有较好的效果。  相似文献   

19.
元规则指导的知识发现方法研究   总被引:4,自引:1,他引:3  
传统的知识发现方法缺乏挖掘的针对性,效率较低,挖掘出的规则数量巨大,需要进行复杂的知识筛选工作;挖掘出的规则用低层次的原始数据表示,难以理解。无规则是对挖掘结果模式的一种表示方法,是将背景知识融入知识发现过程、提高挖掘结果的有趣性和挖掘速度的重要方法。该文研究利用概念表示数据之间的关系,提高规则的可理解性;将概念和无规则相集合,提出了基于概念的无规则指导的知识发现方法,并给出了概念的生成方法和无规则的构造方法。  相似文献   

20.
传统的入侵检测系统在网络上存在自适应差、缺乏扩展性、数据过载等问题,而基于数据挖掘的入侵检测技术通过数据挖掘的方法,自动地从训练数据中提取出入侵检测的知识和模式,很好地解决了传统入侵检测系统中存在的问题.本文提出了一种基于数据挖掘的入侵检测系统模型,分析了几种入侵检测技术的数据挖掘方法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号