首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 203 毫秒
1.
将粗糙集理论中属性重要度和依赖度的概念与分级聚类离散化算法相结合,提出了一种纳税人连续型属性动态的离散化算法。首先将纳税数据对象的每个连续型属性划分为2类,然后利用粗糙集理论计算每个条件属性对于决策属性的重要度,再通过重要度由大至小排序进行增类运算,最后将保持与原有数据对象集依赖度一致的分类结果输出。该算法能够动态地对数据对象进行类别划分,实现纳税人连续型属性的离散化。通过采用专家分析和关联分析的实验结果,验证了该算法具有较高的纳税人连续型属性离散化精度和性能。  相似文献   

2.
针对传统入侵检测算法忽略数据属性间的类别特征,提出基于属性分类建模的入侵检测系统(ACBM-IDS).将数据按属性划分为离散和连续两类,针对离散属性数据以关联规则算法为基础挖掘各类别的最长最大支持度项集,结合稳定性对项集进行加权后构成离散属性判定模型;针对连续属性数据,经归一化后训练Softmax分类器作为连续属性判定...  相似文献   

3.
C4.5算法是一种非常有影响力的决策树生成算法,但该方法生成的决策树分类精度不高,分支较多,规模较大.针对C4.5算法存在的上述问题,本文提出了一种基于粗糙集理论与CAIM准则的C4.5改进算法.该算法采用基于CAIM准则的离散化方法对连续属性进行处理,使离散化过程中的信息丢失程度降低,提高分类精度.对离散化后的样本用基于粗糙集理论的属性约简方法进行属性约简,剔除冗余属性,减小生成的决策树规模.通过实验验证,该算法可以有效提高C4.5算法生成的决策树分类精度,降低决策树的规模.  相似文献   

4.
提出了基于属性重要性的关联分类方法.与传统算法不同的是根据属性重要性程度生成类别关联规则;并且在构造分类器时改进了CBA算法中对于具有相同支持度、置信度规则选择时的随机性.实验结果证明,用该方法得到的分类规则与传统的关联分类算法相比,复杂度低,且有效提高了分类效果.  相似文献   

5.
针对贝叶斯网络后验概率需计算样本边际分布,计算代价大的问题,将共轭先验分布思想引入贝叶斯分类,提出了基于共轭先验分布的贝叶斯网络分类模型.针对非区间离散样本,提出一种自适应的样本离散方法,将小波包提取模拟电路故障特征离散化作为分类模型属性.仿真验证表明,模型分类效果较好,算法运行速度得以提高,也可应用于连续样本和多分类的情况,扩展了贝叶斯网络分类的应用范围.  相似文献   

6.
.连续属性离散化算法比较研究*   总被引:2,自引:0,他引:2  
探讨了贪心及其改进算法、基于属性重要性、基于信息熵和基于聚类四类连续属性离散化算法,并通过实验验证这四类算法的离散化效果.实验结果表明,数据集离散化的效果不仅取决于使用算法,而且与数据集连续属性的分布和决策数据值的分类也有密切关系.  相似文献   

7.
关联规则是数据挖掘的重要研究内容之一.传统的关联规则挖掘算法仅适于处理二元属性与分类属性.为更好地处理数量属性,提出了一种自适应的基于模糊概念的量化关联规则挖掘算法.该算法克服了传统的离散分区法的不足,改进了已有模糊关联规则支持度的计算方法.引入了一种基于聚类的隶属函数自动生成方法,使得模糊关联规则的发现不依赖于人类专家给出的隶属函数,使得关联规则的表示自然、简明,有利于专家理解.实验表明该算法是有效的.  相似文献   

8.
处理连续属性离散化是决策树分类方法中C5.0算法在创建决策树时对数据表示空间的简化的一个重要问题,采用合理有效的连续属性离散化方法可以提高创建决策树的分类预测精度.在分析C5.0算法的离散化方法的不足之处后,提出一种改进Chi2算法的方法,能更合理更准确地对连续属性进行离散化,在此基础上创建的决策树具有更好的准确率.实验结果表明,基于改进方法的C5.0算法创建的决策树分类模型具有较高的分类准确率.  相似文献   

9.
属性频率划分和信息熵离散化的决策树算法   总被引:2,自引:0,他引:2       下载免费PDF全文
决策树是数据挖掘任务中分类的常用方法。在构造决策树的过程中,节点划分属性选择的度量直接影响决策树分类的效果。基于粗糙集的属性频率函数方法度量属性重要性,并用于分枝划分属性的选择和决策树的预剪枝,提出一种决策树学习算法。同时,为了能处理数值型属性,利用数据集的统计性质为启发式知识,提出了一种改进的数值型属性信息熵离散化算法。实验结果表明,新的离散化方法计算效率有明显提高,新的决策树算法与基于信息熵的决策树算法相比较,结构简单,且能有效提高分类效果。  相似文献   

10.
分类是数据挖掘中的一个重要任务。当前许多分类算法一般要求处理离散属性数据,提出了一种新的基于复合粒子群算法,它能对含有连续属性和离散属性值的混合数据进行分类。为提高分类正确率和效率,对基本粒子群采用复合结构编码,通过粒子群算法得到连续属性离散化后的候选分割点并分类,将混合数据分类问题转化为0-1组合优化问题。实验结果证明,该算法有很好的分类效果,而且具有较快的收敛速度。  相似文献   

11.
陶新民  童智靖  刘玉  付丹丹 《控制与决策》2011,26(10):1535-1541
针对传统的支持向量机(SVM)算法在数据不均衡的情况下分类效果不理想的缺陷,为了提高SVM算法在不均衡数据集下的分类性能,提出一种新型的逐级优化递减欠采样算法.该算法去除样本中大量重叠的冗余和噪声样本,使得在减少数据的同时保留更多的有用信息,并且与边界人工少数类过采样算法相结合实现训练样本数据集的均衡.实验表明,该算法不但能有效提高SVM算法在不均衡数据中少数类的分类性能,而且总体分类性能也有所提高.  相似文献   

12.
一种新的基于平衡决策树的SVM多类分类算法   总被引:3,自引:0,他引:3  
为了有效地减少样本训练时间,提高多类分类器的识别率,同时使模型具有较好的推广能力,在综合考虑待分类样本数和类别易分性能的基础上,在"先分样本数较大的类"和"先分易分的类"之间折衷考虑,提出一种基于样本的新的类划分方案.采用半衡决策树结构,得到了一种新的决策树支持向量机多类分类算法.实验结果表明,该算法在不降低识别率的情...  相似文献   

13.
提出一种基于谱聚类欠取样的不均衡数据支持向量机(SVM)分类算法.该算法首先在核空间中对多数类样本进行谱聚类;然后在每个聚类中根据聚类大小和该聚类与少数类样本间的距离,选择具有代表意义的信息点;最终实现训练样本间的数目均衡.实验中将该算法同其他不均衡数据预处理方法相比较,结果表明该算法不仅能有效提高SVM算法对少数类的分类性能,而且总体分类性能及运行效率都有明显提高.  相似文献   

14.
在分析矢量图像颜色信息和动态曲线演化规律的基础上,将归一化传导率的非线性热方程约束项引入变分侧地活动轮廓矢量模型中,使水平集函数不用重新初始化即可快速稳定地保持符号距离函数的特性.改进算法减少了迭代次数和运行时间,改进了图像二维梯度和散度算子传统离散化方式,使梯度和散度算子保持空间旋转不变性,提高了分割算法的鲁棒性.实...  相似文献   

15.
基于粗糙集和图论的电力系统故障诊断方法   总被引:2,自引:0,他引:2  
将粗糙集与图论相结合处理电力系统故障诊断,提出了故障决策表图的新概念,得到一种基于粗糙集和图论的电力系统故障诊断方法,并进一步提出了故障信息覆盖度和故障诊断规则分级的概念.利用故障决策表图及其邻接矩阵,得到了快速识别决策表核属性和属性约简的方法,并将规则分级应用于故障规则提取.利用所提出的方法对具体实例进行处理,仿真结果表明,该方法能有效地减少时间和空间复杂度,可根据设定的阈值提取诊断规则.  相似文献   

16.
王莉  周献中  沈捷 《控制与决策》2012,27(11):1711-1714
Lingras提出的粗K均值聚类算法易受随机初始聚类中心和离群点的影响,可能出现一致性和无法收敛的聚类结果.对此,提出一种改进的粗K均值算法,选择潜能最大的K个对象作为初始的聚类中心,根据数据对象与聚类中心的相对距离来确定其上下近似归属,使边界区域的划分更合理.定义了广义分类正确率,该指标同时考虑了下近似集和边界区域中的对象,评价算法性能更准确.仿真实验结果表明,该算法分类正确率高,收敛速度快,能够克服离群点的不利影响.  相似文献   

17.
传统的基于密度的带噪声空间数据聚类算法主要存在以下问题:聚类只对具有数值属性的数据有效,而对具有非数值属性的数据失效;参数设置困难且聚类结果对参数较为敏感;聚类的度量以绝对密度值为标准,无法发现密度等级不同的聚类结果.针对以上问题,提出一种面向混合属性数据的、基于相对密度的聚类算法 RDBC M,同时提出解决这类问题的增量式聚类算法,并从理论和仿真实验两方面分析、验证了算法的有效性和加速效果.  相似文献   

18.
自适应神经变结构的机器人轨迹跟踪控制   总被引:3,自引:0,他引:3  
提出一种神经网络与变结构融合的控制策略用于非线性机器人控制,该方案利用神经网络来自适应补偿不确定模型,并通过变结构控制器消除逼近误差.考虑到局部泛化网络的不足,根据其状态空间的划分,分别对3个区间采用神经网络与变结构的分级与集成控制.该方案能在控制阶段初期及网络逼近区域外使两种控制器共同起作用以保持系统的强鲁棒性,基于Lyapunov理论证明了闭环系统的全局稳定性.仿真结果进一步表明了该方法的优越性.  相似文献   

19.
针对传统分类算法隐含的假设(相信并且接受每个样本的分类结果)在医疗/故障诊断和欺诈/入侵检测等领域中并不适用的问题,提出嵌入非对称拒识代价的二元分类问题,并对其进行简化.在此基础上设计出基于支持向量机(SVM)的代价敏感分类算法(CSVM-CRC).该算法包括训练 SVM 分类器、计算后验概率、估计分类可靠性和确定最优拒识阈值4个步骤.基于10个 Benchmark 数据集的实验研究表明, CSVM-CRC 算法能够有效降低平均代价.  相似文献   

20.
于水情  李俊民 《控制与决策》2012,27(12):1917-1920
针对一类具有随机时延和非线性扰动的网络控制系统,利用变采样周期的方法,将连续被控对象离散化,使网络控制系统建模为部分转移概率未知的非线性Markov跳变系统.通过随机Lyapunov方法,给出保证整个闭环系统随机稳定的充分条件,同时得到非线性扰动项的最大界.仿真算例表明了所提出方法的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号