共查询到19条相似文献,搜索用时 78 毫秒
1.
决策树算法从一组无规则、无次序的事例中推理出分类规则,同样适用于医疗数据的挖掘。本文研究基于决策树的乳腺肿瘤医疗数据的分析和挖掘,提高癌症诊断的准确率。 相似文献
2.
为了提高软件质量,控制和改汕软件开发过程,需要有效地度量软件开发过程和分析其过程各个阶段收集的度量数据.文中将模糊聚类算法应用到软件度量的数据分析中.先给出了数据挖掘相关知识和理论,再介绍了该算法在软件度量数据分析中应用的实验研究.由于较快地发现有严重缺陷的模块,进而提高了软件测试效率. 相似文献
3.
基于优化聚类算法的安全审计模型 总被引:1,自引:0,他引:1
论文针对网络未知入侵类型检测问题,提出了基于优化聚类算法的安全审计模型。由于攻击类型未知,无法设定聚类数目,这是影响聚类算法在日志分析中应用的主要问题。论文针对这种问题提出了优化的聚类算法,该算法由聚合阶段和优化阶段两部分组成,能自动实现初始聚类集合建立和组合优化,并通过简单的人工干预可准确地标识入侵行为。该算法处理未知入侵检测问题是可行,具有良好的可扩展性,大大降低了算法对控制参数的依赖性,提高了该方法的实用性。 相似文献
4.
为了提高软件质量,控制和改汕软件开发过程,需要有效地度量软件开发过程和分析其过程各个阶段收集的度量数据。文中将模糊聚类算法应用到软件度量的数据分析中。先给出了数据挖掘相关知识和理论,再介绍了该算法在软件度量数据分析中应用的实验研究。由于较快地发现有严重缺陷的模块,进而提高了软件测试效率。 相似文献
5.
6.
7.
8.
9.
在分布式环境下,实现隐私保护的数据挖掘,已成为该领域的研究热点。文中着重研究在垂直分布数据中,实现隐私保护的决策树分类模型。该模型创建新型的隐私保护决策树,即由在茫然半诚实方存储的全局决策表和各站点存储的局部决策树组成,并结合索引数组和秘密数据比较协议,实现在不泄漏原始信息的前提下决策树的生成和分类。经过理论分析和实验验证,证明该模型具有较好的安全性、准确性和适用性。 相似文献
10.
11.
基于数据挖掘的决策树方法分析 总被引:1,自引:0,他引:1
决策树方法因其简单、直观、准确率高等特点在数据挖掘及数据分析中得到了广泛的应用。在介绍了决策树方法的一般知识后,深入分析了决策树的生成算法与模型,并对决策树的剪枝过程进行了探讨。 相似文献
12.
网络教育经过十年的发展,网络学院已经积累了大量的教学和学生数据。对这些数据进行整理和预处理,采用基于决策树的数据挖掘,发现相关的学习规律,帮助教务员和教师调整教学策略,提高网络教学质量。 相似文献
13.
14.
数据挖掘是一种新的信息处理技术,其主要特点是对数据库中的大量数据进行抽取、转换、分析和其他模型化处理,并从中提取辅助决策的关键性数据。其中,判定树以其出色的数据分析效率、直观易懂的结果展示等特点,倍受广大用户的关注。本文将讨论数据挖掘中的判定树在学生成绩分析的应用。 相似文献
15.
为了有效地利用蛋白质串联质谱数据,进一步提高蛋白质鉴定的准确性,提出一种基于决策树的蛋白质鉴定结果的二次评价算法.目前,串联质谱已经成为解决蛋白质鉴定问题的最为有效的技术手段.随着蛋白质串联质谱数据的大量聚集,蛋白质鉴定算法也日益增加.然而,现有的蛋白质鉴定算法通常返回数量庞大的结果列表,因此对列表中的鉴定结果进行二次评价是提高蛋白质鉴定准确性的一个重要环节.针对此问题,首先利用频繁模式挖掘方法获得了b离子的特征信息,进而基于决策树理论提出一种蛋白质鉴定结果的二次评价算法即ReCheck算法.实验结果表明,该算法有效的提高了蛋白质鉴定的准确性. 相似文献
16.
数据挖掘中决策树的探讨 总被引:29,自引:1,他引:29
决策树方法是数据挖掘中的一个重要内容。该文叙述了决策树的构建过程,并指出了其技术难点及构建算法,最后,通过一个实例给出了该算法选取决策属性的详细过程。 相似文献
17.
18.
提出了一种利用数据库分组记数技术构造决策树的算法,利用数据库系统的结构化查询语言来实现主要的样本统计计算任务。并将构造决策树的过程与相关属性的选择方法有机地结合在一起。使用这些方法和策略,该算法能较快速地生成决策树,与ID3算法相比,在不影响决策树分类准确度的前提下,具有较高的执行效率。 相似文献
19.
本文提出了一种处理多属性数据集的快速可扩展性并行分类算法-FSPC算法。它首次采用了纵向划分数据集以及在测试属性的选择过程中同步划分数据集等方法。实验结果表明,它不仅有利于减少通信及进行I/O的开销,而且有利于提高算法的并行度。 相似文献