共查询到20条相似文献,搜索用时 63 毫秒
1.
2.
3.
本文提出一种基于决策树ID3算法的软件使用用户分类方法,利用软件的运行日志提取出软件使用记录的主要属性数据,对源数据进行数据预处理转化为挖掘算法可用数据集,从中提取出软件使用用户的分类规则,构建分类模型并根据形成的规则找出使用软件的异常用户,从而便于管理人员对B/S模式软件数据库系统的安全管理和维护。 相似文献
4.
共享知识挖掘是指通过学习不同事物之间的共享知识,将学习到的知识应用到未知事物来加快认知未知事物。针对大数据集中串行共享知识挖掘算法效率低下的问题,结合云计算技术,提出了一种基于Hadoop的并行共享决策树挖掘算法(PSDT)。该算法采用传统的属性表结构实现并行挖掘,但 其I/O操作过多,影响算法性能,为此,进一步提出了一种混合并行共享决策树挖掘算法(HPSDT)。该算法采用混合数据结构,在计算分裂指标阶段使用属性表结构,在分裂阶段采用数据记录结构。数据分析表明,HPSDT算法简化了分裂过程,其I/O操作是PSDT的0.34左右。实验结果表明,PSDT和HPSDT都具有良好的并行性和扩展性;HPSDT比PSDT性能更好,并且随着数据集的增大,HPSDT的优越性更加明显。 相似文献
5.
6.
《计算机应用与软件》2014,(8)
针对常规决策树算法在挖掘数据流时存在的不足,提出一种基于正态分布的决策树NDDT(Normal Distribution Decision Tree)算法。从近似正态分布的相关定理出发,详细分析算法的具体实现过程,给出算法实现的伪代码及注释,并借助Matlab软件进行建模与仿真。结果表明,NDDT算法具有精度高、精度不依赖于参数δ、处理时间短及处理时间与训练数据样本呈近似线性关系等优点。因此NDDT算法具有可行性、可靠性及良好的应用前景。 相似文献
7.
一种基于决策树的快速关联规则挖掘算法 总被引:2,自引:0,他引:2
本文对关联规则的挖掘问题进行了深入研究.在总结现有算法优缺点的基础上,提出了一种新的基于决策树的快速关联规则挖掘算法(RABDT),结合决策树的构造过程,给出了算法的原理和实现步骤,并通过实验对比验证了算法的有效性. 相似文献
8.
随着生物科学技术的发展,其数据量的增长也非常迅速,很难在一定合理的时间内对数据进行建模和分析。因此,对并行数据挖掘算法的研究巳变成解决此问题的重要途径。决策树途径巳被广泛用作一种重要的分类工具,本文研究了几种决策树的并行训练策略并对它们的性能进行了比较。 相似文献
9.
针对传统ID3算法计算过程复杂以及存在信息冗余的问题,提出了一种改进算法——基于粗糙集属性约简的简化ID3算法.该算法利用粗糙集中属性约简的性质删掉了系统中多余的知识,在保证同样的分类能力下使得分类系统更简洁,同时借助了泰勒公式对熵公式进行化简,使得计算更简便,然后把改进的算法用到实例中去,并用相关数据库上的大量数据编... 相似文献
10.
基于决策树的神经网络 总被引:5,自引:0,他引:5
传统人工神经网络模型采用试探的方法确定合适的网络结构,并随机地初始化参数值,导致神经网络训练效率低、结果不稳定.熵网络是一种建立在决策树之上的3层前馈网络,在熵网络基础上,提出了基于决策树的神经网络设计方法(DTBNN). DTBNN中提供了对神经网络参数的初始值合理设置的方法,并提出了由决策树确定的只是熵网络的初始结构,在实际的网络构造中需要根据实际应用添加神经元和连接权以提高网络的性能.理论分析和实验结果表明了这种方法的合理性. 相似文献
11.
基于Rough Set的一种决策树的确定算法 总被引:5,自引:0,他引:5
决策树是一种有效用于分类的数据采掘方法,通常是通过信息熵的计算去选择分枝属性,计算量大而复杂。文章利用粗集理论中相对正域的概念,找到另一种信息熵的等效表示方法,只要通过简单的集合运算,便可对协调和非协调决策表得到相应的确定和非确定性决策树,从而得到分类规则。 相似文献
12.
提出了一种基于类别特征矩阵的决策树算法。该算法以决策表的核属性为起点,充分考虑了可辨识矩阵的特性和单个属性的重要性,利用类别特征矩阵对决策表实现最简化决策表的确定和决策规则的挖掘,最后实现最简规则的决策树生成。通过应用实例比较分析,证明该算法能生成最小化决策树,并且决策树生成规则切合实际。 相似文献
13.
14.
为了提高决策树分类的速度和精确率,提出了一种基于分类矩阵的决策树算法.介绍了ID3算法的理论基础,定义了一种分类矩阵,指出了ID3算法的取值偏向性并利用分类矩阵给出了证明.在此基础上,引入了一个权重因子,抑制了原有算法的取值偏向,并利用分类矩阵给出相应证明,同时根据基于分类矩阵增益的特点,提出了新的决策树分类方案,旨在运算速率上进行优化,与原有算法进行了实验比较.对实验结果分析表明,优化后的方案在性能上有明显改善. 相似文献
15.
基于修正系数的决策树分类算法 总被引:1,自引:1,他引:1
ID3算法是决策树算法中的经典算法,但存在多值偏向问题.一些改进的ID3算法虽避免了多值偏向问题,但多存在主观性强,没有考虑属性信息熵等问题.为了解决该问题,提出了一种基于修正系数的决策树分类算法MC.该算法利用修正系数降低取值个数多的属性的信息增益,并通过实验与ID3算法进行了比较,结果表明,当样本集中各属性取值个数不同时,算法MC在生成决策树的结点总数和分类准确率上明显优于ID3算法. 相似文献
16.
基于S-CART决策树的多关系空间数据挖掘方法 总被引:1,自引:0,他引:1
针对空间数据关系复杂的情况,提出了一种改进的多关系数据挖掘结构分类与回归树(S-CART)算法,该算法首先利用空间关联索引表抽取不同主题图层之间的关系原子命题,然后基于逻辑谓词创建多关系二叉决策树,抽取空间关联规则,同时基于我国湖北大冶部分地区土壤污染数据验证算法的有效性。 相似文献
17.
基于KPCA的决策树方法及其应用 总被引:2,自引:0,他引:2
主成分分析(PCA)作为一种数据减少技术常用于构造决策树,有利于降低树的复杂度和提高分类精度,但在处理非线性问题时往往不能取得好的效果.针对上述情况,提出了一种基于核主成分分析(KPCA)的决策树方法.实验结果表明,该方法是可行的和有效的,且在分类精度、方差贡献率等方面优于基于PCA的决策树. 相似文献
18.
19.
基于决策树方法的特定主题Web搜索策略 总被引:2,自引:0,他引:2
基于数据挖掘中决策树方法提出了一种新的Web搜索策略。在该策略中,通过对预先采集的Web页面进行学习得到一棵决策树,然后对其进行剪枝,得到简化布尔表达式形式的主题内在规律性信息,在其基础上进行查询修改,把修改后的查询转发到通用搜索引擎上,最终得到查询结果。实验结果表明,提出的查询策略对于特定主题的Web搜索,查询结果的质量有明显的改善和提升。 相似文献
20.
对于非崩溃的错误,测试人员往往花费大量的时间才能发现。为了快速准确地定位这类错误,降低软件开发成本,提高软件质量,提出一种辅助定位非崩溃错误的方法。该方法通过收集程序的执行轨迹信息,构造出程序调用图。提取频繁边,运用J48决策树算法,得到基于方法粒度的故障决策树,可辅助人员判定软件缺陷。通过实验与分析,进一步验证了该方法的有效性。 相似文献