首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
用知识发现的思想来解决决策型工艺知识获取问题。定义了工艺决策数据表(PDDT)的概念,用它存储工艺决策数据样本,并基于CLS(Concept Learning System)算法提出了一种改进的工艺决策树学习算法,采用ID3(Iterative Dichotomizer 3)算法来度量工艺决策数据表中条件属性对于工艺决策规则的重要性,进而构建工艺决策树,提出了工艺决策树简化处理的原则以及转换为工艺决策规则的方法。  相似文献   

2.
一种基于信息熵建立决策树的算法   总被引:2,自引:0,他引:2  
信息论给出了信息的数学本质,提出了用热力学中的熵来度量信息量的大小。分类是一个重要的数据挖掘问题,在训练数据集上建立分类树的关键是如何选择决策树每一个内部结点的测试属性。传统的决策树建立算法利用信息论中熵的概念选择属性,具有偏向于取值较多属性的缺点。本文分析了信息论中有关熵的一些基本概念和含义,讨论了它们在挖掘分类树中的应用,利用互信息设计了一个建立分类树的算法,克服了传统算法的缺点。  相似文献   

3.
基于全球地理信息中海量属性数据,提出了利用已有数据构建索引和批量插入索引数据的改进算法。使用自底向上构建索引算法建立索引树,提高了空间利用率和建库速度;采用缓冲页法批量插入数据,提高了插入效率,减少了节点分裂次数。该算法不但适用于建立索引库,而且适用于更新索引库。  相似文献   

4.
基于构建有序决策树,提出了一种新的归纳算法。该算法选择的扩展属性不仅和类的有序互信息值最大,而且要求和同一分支上已被用过的条件属性的有序互信息值最小。实验结果表明,考虑了条件属性之间的相关性后,可避免同一条件属性的重复选择,真正体现了条件属性和决策属性之间的有序互信息,与已有的算法相比,提高了测试精度。  相似文献   

5.
当前信用评级普遍采用的传统方法如专家法、信用评分法中,属性的权重大小受评价者主观影响大,可能造成评价结果偏差失准,并增加评价的时间消耗。本文将决策树模型引入信用评级体系中,在道路客运行业信用评级体系中建立一种新的评价方法。结果表明,采用ID3算法的决策树方法通过定量计算训练集样本中各属性互信息的大小,可以迅速地得到一棵决策树,从而通过对训练样本的统计计算避免了主观判断属性权重带来的弊端。当该决策树经过全面、良好的测试和调整后,可足够健壮,能较好地运用于信用评价。  相似文献   

6.
决策树技术是一种对海量数据集进行分类的非常有效方法。通过构造决策树模型,提取有价值的分类规则,帮助决策者做出准确的预测已经应用在很多领域。基于这种技术构造的蘑菇可食用性决策树模型,提供了通过蘑菇属性判别蘑菇可食用性的科学依据。决策树算法采用C4.5算法,它把信息增益率作为属性选择的度量标准。从实验结果来看,决策树模型虽然显示了一个很不平衡的结构,但得出了很容易理解的决策规则。  相似文献   

7.
决策树是数据挖掘任务中分类的常用方法。在构造决策树的过程中,节点划分属性选择的标准直接影响决策树分类的效果。基于粗糙集的属性频率函数等方法度量属性重要性的概念,将其用于分枝划分属性的选择,提出一种决策树学习算法。该方法仅利用区分矩阵就可以计算出属性的出现频率函数值,计算简单。实验结果表明,用该方法构造的决策树与传统的基于信息熵方法构造的决策树相比较,结构简单,且能有效提高分类效果。  相似文献   

8.
本文介绍了一种基于粗糙集理论来构建变压器故障诊断多变量决策树的算法。该方法选择变压器故障决策表的相对于决策属性的范化作为决策树的根节点,再选择粗糙度最小的条件属性作为下一个分枝节点的检验属性,形成结构更为简洁合理的变压器故障诊断多变量决策树。通过实例比较验证了该方法的有效性。  相似文献   

9.
本文介绍了一种基于粗糙集理论来构建变压器故障诊断多变量决策树的算法。该方法选择变压器故障决策表的相对于决策属性的范化作为决策树的根节点,再选择粗糙度最小的条件属性作为下一个分枝节点的检验属性,形成结构更为简洁合理的变压器故障诊断多变量决策树。通过实例比较验证了该方法的有效性。  相似文献   

10.
一种基于互信息增益率的新属性约简算法   总被引:13,自引:1,他引:13  
为了获得决策系统中更好的相对属性约简,提出了一种基于互信息增益率的属性约简算法.该算法考虑了所选择条件属性与决策属性的互信息,还考虑了所选择属性的值的分布情况,从信息论角度定义了基于互信息增益率的属性重要性度量方法,并以此度量为启发式信息,算法从空集开始逐步将最重要的条件属性加入到选择属性集,直到所选择的条件属性集与决策属性集的互信息等于整个条件属性集与决策属性集的互信息时,算法停止.结果表明,算法能更有效地对决策系统进行约简,同时约简后的对象数目较少.  相似文献   

11.
部分指标权重信息下的区间数多指标决策方法   总被引:1,自引:0,他引:1  
针对指标权重信息部分已知、部分未知且指标值为区间数形式的多指标决策问题,提出一种决策分析方法.在对具有部分指标权重信息的区间数多指标决策问题进行数学描述的基础上,依据传统的理想点方法的基本思路,给出解决指标权重信息不完全的区间数多属性决策问题的计算步骤,其核心是通过构建最优化模型,得到每个方案与正理想点、负理想点的差异值,进而通过计算出相对接近度,即可得到所有方案的排序结果.通过一个算例说明该方法的实用性和有效性.  相似文献   

12.
预警机指挥机群协同防御空战的威胁评估方法研究   总被引:1,自引:0,他引:1  
为了实现预警机在指挥机群协同防御空战中的威胁评估问题,文章建立了一种属性权重未知的混合型多属性决策模型.为能同时处理定量与定性数据,将模糊数转化为精确数得到规范的决策矩阵.基于属性熵,建立了具有柔性调节能力的属性客观权重熵系数模型,实现了主观与客观权重的综合.最后,通过实例计算及敏感性分析,验证了将上述方法应用于预警机的威胁评估可行、有效.  相似文献   

13.
针对现有方法对与正常消息相似度较高的畸形SIP消息检测效果不佳的问题,提出了一种基于c4.5决策树的IMS网络畸形SIP消息检测方法。该方法首先利用n—gram技术将SIP消息映射至高维空间,利用样本属性的信息增益进行特征提取;然后基于C4.5决策树算法,根据特征属性的信息增益率构建决策树并对畸形SiP消息进行检测;最后定义了畸形SIP消息构造函数并构建相应样本数据集,对该方法进行了仿真验证。仿真结果表明,该方法对与正常消息相似度较高的畸形SIP消息具有94.8%的检测率。  相似文献   

14.
提出一种基于信息测度对取值范围大的属性进行分划(分类)的方法,即开始对属性的值域划分为两类,其分断点为使信息获取量为最大,再划分为三类,也取其分断点(两个)为使信息获取量为最大值,当增加分类不能较多地提供信息获取量或分类数为预先约束范围,则终止划分,并通过例子说明此算法的具体应用。  相似文献   

15.
基于投影及优势度的不确定语言群决策方法   总被引:1,自引:0,他引:1  
针对属性权重信息不完全的多粒度不确定语言多属性群决策问题,提出一种基于投影及优势度的群决策方法.该方法采用连续区间二元语义的有序加权调和平均(ITC-OWH)算子将多粒度不确定语言评价矩阵转化为二元语义决策矩阵,基于投影法构建目标规划模型,从而确定单个决策者的属性权重向量.在每个决策者之下,计算任意2个方案之间比较的综合属性优势度,根据综合优势度矩阵及决策者权重向量获得群体综合优势度矩阵,由各方案的总优势度获取方案的排序结果.最后,将提出的群决策方法应用到潜艇研制方案遴选问题中,验证了该方法的可行性与有效性.  相似文献   

16.
SVM决策树能够较好地进行Web文本信息分类,在此基础上进一步结合遗传算法,将SVM决策树分类器的分类正确率作为GA适应度函数,对SVM决策树层次结构进行优化,在每一决策节点自动选择最优或近优的分类决策。实验结果表明,采用该方法进行多类分类,分类精度明显提高,体现了将遗传算法与SVM决策树结合的优越性。  相似文献   

17.
从不确定区间数的中值与半宽角度出发研究属性权重信息完全未知且属性值以区间数形式给出的多属性决策问题。文中给出区间数定义,构建中值-半宽(M-H)区间数排序方法与运算法则;给出基于(M-H)区间数决策矩阵的规范化方法,依据决策方案与理想方案的关联系数离差最大化原则,提出求解属性权重的优化方法,并通过实例验证了该方法的实用性和有效性。  相似文献   

18.
采用一种属性约简算法,将待分类的数据样本进行两次约简处理--初次决策表属性约简和基于核属性值的二次约简。通过属性约简方法来删除数据集中的冗余数据,进而提高KNN算法的分类精度。在此基础上应用MapReduce并行编程模型,在Hadoop集群环境上实现并行化分类计算实验。实验结果表明,改进后的算法在集群环境下执行的效率得到很大提升,能够高效处理实验数据。实验执行的加速比也有明显提高。  相似文献   

19.
基于直觉梯形模糊数的信息不完全多属性决策方法   总被引:1,自引:0,他引:1  
针对权重信息不完全未知且属性值为直觉梯形模糊数的多属性决策问题,给出了基于直觉梯形模糊数得分函数和投影模型下的多属性决策方法,通过投影法建立了非线性规划模型,并通过数学软件得到各属性权重,通过投影率作为排序指标,进行排序择优。最后通过实例说明了该方法的有效性。  相似文献   

20.
1 Introduction D atabases are rich w ith hidden inform ation that can be used for m aking intelligentbusiness decisions. C lassification is one form of data analysis thatcan be used to extractm odels describing im portantdata class- es.There have m any ap…  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号