共查询到20条相似文献,搜索用时 125 毫秒
1.
模糊聚类分析在数据挖掘中的应用研究 总被引:15,自引:0,他引:15
数据挖掘是从大量数据中用平凡的方法发现有用的知识。聚类分析是数据挖掘的一个重要研究领域,它是按照一定的要求和规律将事物进行分类的一种数学方法。随着模糊数学的兴起,用精确的数学的方法研究模糊问题,人们逐渐将精确和模糊统一起来。论文将模糊数学的模糊理论应用于数据挖掘的聚类分析中,讨论了如何利用样本之间的模糊关系分析样本之间的关联程度,给出了模糊聚类分析在数据挖掘中的应用的主要步骤,以及相应的实例分析和程序设计。 相似文献
2.
1 引言知识发现(Knowledge discovery in database,KDD)是应用一系列技术从大型数据库或数据仓库中提取隐含的、未知的、非平凡的对决策有潜在应用价值的知识和信息的过程,提取的知识表示为概念、规则、规律、模式等形式。知识发现过程一般由三个主要的阶段组成:数据准备,数据开采,结果表达和解释。知识发现的主要方法是数据总结、分类发现、聚类分析和关联规则的发现。其中分类是知识发现中非常重要的方法。现在从统计学和机器学习的角度提出了较多的分类技 相似文献
3.
模糊聚类分析方法在DNA序列分类中的应用 总被引:3,自引:0,他引:3
该文采用模糊聚类分析的方法对DNA序列进行分类.首先从DNA序列中单个碱基分布的“密度”角度出发,提取出DNA序列的特征,然后用模糊聚类分析中常用的方法对DNA序列进行分类.该文运用自行研制开发的集成11种模糊聚类分析算法的模糊聚类分析运算工具,首先对已知的1-20个DNA序列进行模糊聚类分析,根据分类结果的精度,找出了较优的6种聚类分析算法,然后用余下的21-40个DNA序列进行分类;最后,本文一次对所有的1-40个DNA序列进行归类,并综合了所有的分类结果,将难以归类的DNA序列进行了归类.分析结果表明,模糊聚类分析算法具有分类简单且分类结果精度较高的优点. 相似文献
4.
知识发现技术能发现数据中有用的模式和知识,但如何和专家系统有效集成仍然尚未得到解决.本文从知识表示的角度探讨二者集成,提出一种面向知识发现的广义综合知识表示方法.该方法能有效表示包括关联、分类、序贯、神经网络、基于案例推理等在内的多种知识类型,同时该方法将知识发现方法表示在其内部,从而有利于自动知识获取的实现.在此基础上提出一种新型专家系统原型.该原型从语义、机制和接口三个层次集成知识发现技术,可以有效进行自动知识获取. 相似文献
5.
基于PCA与ICA特征提取的入侵检测集成分类系统 总被引:10,自引:0,他引:10
入侵检测系统不仅要具备良好的入侵检测性能,同时对新的入侵行为要有良好的增量式学习能力.提出了一种入侵检测集成分类系统,将主成分分析(PCA)和独立成分分析(ICA)与增量式支持向量机分类算法相结合构造两个子分类器,采用集成技术对子分类器进行集成.系统利用支持向量集合对已有的入侵知识进行压缩表示,并采用遗传算法自适应地调整集成分类系统的权重.数值实验表明:集成分类系统通过自适应训练权重,综合了两种特征提取子分类器的优点,具有更好的综合性能. 相似文献
6.
7.
遥感影像分类一直是遥感领域的研究热点.集成学习通过多个单一分类器得到的分类信息进行综合来提高分类的精度.论文阐述了集成技术的常用算法和策略,给出了遥感数据分类采用单分类算法,Bagging,Boosting以及MCS集成分类的实验结果的比较和分析.实验表明,集成技术能有效提高遥感数据的分类精度.在训练样木少的情况下,提供了一种保证分类性能和泛化性的有效途径. 相似文献
8.
随着网络的迅速发展,网络上的信息越来越丰富,如何发现潜在的有用知识将成为今后发展的方向。本文在分析了向量表示法的弊端之后,提出了利用文件指纹对Web文本进行分类的方法,然后再利用k-means算法对所分类文本进行聚类分析,得到所需结果。通过文本挖掘模型,建立起可操作性的挖掘方法。 相似文献
9.
10.
11.
12.
.数据挖掘是信息技术自然演化的结果,使用数据挖掘工具进行数据分析可以方便的获得重要的知识并应用于决策,提出一种基于本体的数据挖掘算法,讨论使用本体的方法来协助数据挖掘. 相似文献
13.
提出了3种实用的软件数据挖掘方法:评价指标法,中心知识法,偏离度法。介绍了这3种常用软件数据挖掘的概念,给出了它们的具体模型,最后对这3种软件数据挖掘方法进行了比较和评价。 相似文献
14.
粗集理论能支持数据挖掘与知识发现的多个步骤,如数据预处理、数据简化、规则生成、数据依赖关系获取等,为数据挖掘与知识发现提供了新的思路和方法。本文将粗集理论引入空间数据挖掘领域,介绍了粗集理论的基础理论和一系列方法,给出了应用实例,并探讨粗集理论在空间数据挖掘中的应用。 相似文献
15.
杨德印 《数字社区&智能家居》2010,(4):902-903
该文在以基因本体论GO(Gene Ontology,GO)为例考察生物领域知识对基于机器学习的基因挖掘方法的影响。通过基因芯片表返谱数据实验,考察几种基因挖掘方法用与不用GO信息的效果,结果表明利用GO信息,基因挖掘方法都能得到改善。 相似文献
16.
The first part of this paper served as a comprehensive survey of data mining methods that have been used to extract knowledge from solutions generated during multi-objective optimization. The current paper addresses three major shortcomings of existing methods, namely, lack of interactiveness in the objective space, inability to handle discrete variables and inability to generate explicit knowledge. Four data mining methods are developed that can discover knowledge in the decision space and visualize it in the objective space. These methods are (i) sequential pattern mining, (ii) clustering-based classification trees, (iii) hybrid learning, and (iv) flexible pattern mining. Each method uses a unique learning strategy to generate explicit knowledge in the form of patterns, decision rules and unsupervised rules. The methods are also capable of taking the decision maker’s preferences into account to generate knowledge unique to preferred regions of the objective space. Three realistic production systems involving different types of discrete variables are chosen as application studies. A multi-objective optimization problem is formulated for each system and solved using NSGA-II to generate the optimization datasets. Next, all four methods are applied to each dataset. In each application, the methods discover similar knowledge for specified regions of the objective space. Overall, the unsupervised rules generated by flexible pattern mining are found to be the most consistent, whereas the supervised rules from classification trees are the most sensitive to user-preferences. 相似文献
17.
The discovery of experts'' decision rules from qualitative bankruptcy data using genetic algorithms 总被引:1,自引:0,他引:1
Numerous studies on bankruptcy prediction have widely applied data mining techniques to finding out the useful knowledge automatically from financial databases, while few studies have proposed qualitative data mining approaches capable of eliciting and representing experts' problem-solving knowledge from experts' qualitative decisions. In an actual risk assessment process, the discovery of bankruptcy prediction knowledge from experts is still regarded as an important task because experts' predictions depend on their subjectivity. This paper proposes a genetic algorithm-based data mining method for discovering bankruptcy decision rules from experts' qualitative decisions. The results of the experiment show that the genetic algorithm generates the rules which have the higher accuracy and larger coverage than inductive learning methods and neural networks. They also indicate that considerable agreement is achieved between the GA method and experts' problem-solving knowledge. This means that the proposed method is a suitable tool for eliciting and representing experts' decision rules and thus it provides effective decision supports for solving bankruptcy prediction problems. 相似文献
18.
19.
元规则指导的知识发现方法研究 总被引:4,自引:1,他引:3
传统的知识发现方法缺乏挖掘的针对性,效率较低,挖掘出的规则数量巨大,需要进行复杂的知识筛选工作;挖掘出的规则用低层次的原始数据表示,难以理解。无规则是对挖掘结果模式的一种表示方法,是将背景知识融入知识发现过程、提高挖掘结果的有趣性和挖掘速度的重要方法。该文研究利用概念表示数据之间的关系,提高规则的可理解性;将概念和无规则相集合,提出了基于概念的无规则指导的知识发现方法,并给出了概念的生成方法和无规则的构造方法。 相似文献