共查询到20条相似文献,搜索用时 11 毫秒
1.
基于变精度粗糙集理论提出了具有置信度规则决策树的新的构造方法,该方法采用β-边界域的大小作为选择分类属性的标准,并对叶节点的置信度进行了重新的定义。经实验证明,该方法能有效提高分类效率且更加容易理解。 相似文献
2.
食品安全决策是食品安全问题研究的一项重要内容。为了对食品安全状况进行分析,基于粗糙集变精度模型,提出了一种包含规则置信度的构造决策树新方法。这种新方法针对传统加权决策树生成算法进行了改进,新算法以加权平均变精度粗糙度作为属性选择标准构造决策树,用变精度近似精度来代替近似精度,可以在数据库中消除噪声冗余数据,并且能够忽略部分矛盾数据,保证决策树构建过程中能够兼容部分存在冲突的决策规则。该算法可以在生成决策树的过程中,简化其生成过程,提高其应用范围,并且有助于诠释其生成规则。验证结果表明该算法是有效可行的。 相似文献
3.
本文在应用变精度粗糙集模型构造决策树的研究基础上,提出了具有置信度规则的决策树的构造方法。该方法是对决策树生成方法的一个改进,所构造的决策树具有更强的实用性以及更高的可理解性。本文还针对两个甚至两个以上属性的分类质量量度相等的特殊情形,给出了如何选择较优的属性作为结点的方法。与传统的ID3算法相比,该方法所构造的决策树不仅结构简单,而且更加实用,利于理解。 相似文献
4.
基于变精度粗糙集的决策树优化算法研究 总被引:4,自引:2,他引:4
应用变精度粗糙集理论,提出了一种利用新的启发式函数构造决策树的方法。该方法以变精度粗糙集的分类质量的量度作为信息函数,对条件属性进行选择。和ID3算法比较,本方法充分考虑了属性间的依赖性和冗余性,尤其考虑了训练数据中的噪声数据,允许在构造决策树的过程中划入正域的实例类别存在一定的不一致性,可简化生成的决策树,提高决策树的泛化能力。 相似文献
5.
针对决策树构造中存在的最优属性选择困难、抗噪声能力差等问题,提出了一种新的基于变精度粗糙集模型的决策树构造算法.该算法采用近似分类精度作为节点选择属性的启发函数,与传统基于粗糙集的决策树构造算法相比,该算法构造的决策树结构简单,提高了决策树的泛化能力,同时对噪声也有一定的抑制能力. 相似文献
6.
针对ID3算法构造决策树复杂、分类效率不高等问题,本文基于变精度粗糙集模型提出了一种新的决策树构造算法。该算法采用加权分类粗糙度作为节点选择属性的启发函数,与信息增益相比,该标准更能够全面地刻画属性分类的综合贡献能力,计算简单,并且可以消除噪声数据对选择属性和生成叶节点的影响。实验结果证明,本算法构造的决策树在规模与分类效率上均优于ID3算法。 相似文献
7.
通过正交实验,可以获得最少的实验次数,但是由于选择样本的盲目性决定所测得的样本中可能不包含最优样本,如果要找到最优样本就必须进行大量的后续实验。针对这些特点以及实验本身存在误差,提出了基于变精度粗糙集理论的正交实验设计方法,通过比较条件属性对决策属性的B分类质量来设计实验参数,结果表明大大提高了实验工作的效率和质量。 相似文献
8.
9.
10.
基于变精度粗糙集理论的属性约简 总被引:2,自引:0,他引:2
针对变精度粗糙集理论的属性约简问题,从属性依赖度增量、互信息增量以及条件属性相对于决策属性的覆盖度与准确度相结合的量度等角度对属性重要度进行分析,并分别以这三个属性重要度的度量作为启发式信息,给出变精度粗糙集属性约简的启发式算法,同时将以上算法应用Matlab程序进行实现。最后,给出具体的算例利用所给的算法求得信息系统的在不同启发式信息下的属性约简,并对所得的结果进行比较,从而说明所给算法的有效性和实用性。 相似文献
11.
12.
将Ziarko的集合变精度包含思想引入模糊粗糙集模型中,使用!-精度集结算子生成变精度模糊粗糙集,用于大型数据库的模糊数据分析。改进后的模型对噪声数据具有一定的容错能力,从而增强了其在实际问题处理中的鲁棒性及适应新情况和知识预测的能力。 相似文献
13.
基于粗糙集理论的决策树分类方法 总被引:1,自引:0,他引:1
决策树是数据挖掘中常用的分类方法。本文提出了基于粗糙集的决策树方法,利用粗糙集近似精确度来选择决策树的根节点,分支由分类产生。该方法计算简单,易于理解。本文还提出用悲观剪枝法简化决策树,提高决策树的预测与分类能力。实例说明了本文方法均简单有效。 相似文献
14.
15.
精准且快速地识别异常用户行为是入侵检测系统(IDS)的重要任务。针对入侵检测数据维度高、样本量大的问题,提出了基于变精度覆盖粗糙集的相关族属性约简方法,并将其运用至入侵检测数据中。首先,基于覆盖决策表生成条件属性的变精度相关族;然后,在所有条件属性变精度相关族的基础上利用启发式算法求得决策表的属性约简;最后,在上述的基础上结合分类器对入侵检测数据进行检测。实验结果表明,所提方法具有计算属性约简时间短的优点,在大样本数据集上,基于模糊粗糙集依赖度的属性约简算法NFRS运行所需时长为该算法的96倍。在入侵检测数据集NSL-KDD上,该方法可快速识别关键属性,剔除无效信息,其整体准确率可达到90.53%,且对Normal的识别准确率可达到97%。 相似文献
16.
精准且快速地识别异常用户行为是入侵检测系统(IDS)的重要任务。针对入侵检测数据维度高、样本量大的问题,提出了基于变精度覆盖粗糙集的相关族属性约简方法,并将其运用至入侵检测数据中。首先,基于覆盖决策表生成条件属性的变精度相关族;然后,在所有条件属性变精度相关族的基础上利用启发式算法求得决策表的属性约简;最后,在上述的基础上结合分类器对入侵检测数据进行检测。实验结果表明,所提方法具有计算属性约简时间短的优点,在大样本数据集上,基于模糊粗糙集依赖度的属性约简算法NFRS运行所需时长为该算法的96倍。在入侵检测数据集NSL-KDD上,该方法可快速识别关键属性,剔除无效信息,其整体准确率可达到90.53%,且对Normal的识别准确率可达到97%。 相似文献
17.
将变精度粗糙集的思想引入相容粗糙集,提出了两种变精度相容粗糙集模型,在模型I中,目标概念的下近似和边界域的交集非空;在模型II中,目标概念的下近似和边界域的交集为空。研究了两种模型中上、下近似算子的基本性质、两种模型之间的关系,以及与其他粗糙集模型之间的关系。 相似文献
18.
19.
多重变精度粗糙集模型 总被引:1,自引:0,他引:1
为了解决Zaike变精度粗糙集模型的论域划分不能重叠的问题,基于多重集合,对Zaike变精度粗糙集模型的论域进行了扩展,提出了基于多重集的多重变精度粗糙集模型,给出了该模型的完整定义、相关定理和重要性质,其中包括多重论域定义、多重变精度近似集的定义及其性质的证明、与Zaike变精度粗糙集的关系等。这些定义、定理和性质与Zaike变精度粗糙集既有区别又有联系。多重变精度粗糙集可充分反映知识颗粒间的重叠性,对象的重要度差别及其多态性,这样有利于用粗糙集理论从保存在关系数据库中的具有一对多、多对多依赖性的且认为不相关的数据中发现相关知识。 相似文献
20.