首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 605 毫秒
1.
一种改进的启发式离散化算法及应用   总被引:1,自引:0,他引:1  
Nguyen S.H提出的布尔逻辑和粗糙集理论相结合的离散化算法是粗糙集理论中的离散化算法在思想上的重大突破。通过定义分界点来区分Nguyen S.H离散化算法中定义的断点对决策系统的分辨关系是否有贡献,并仅取分界点集作为初始断点集,使得初始断点数目较大幅度地降低,提出了一种改进的启发式离散化算法并应用于一个实际的决策系统的连续属性离散化。应用实例表明改进算法较大程度地减小了算法空间复杂性和时间复杂性,具有正确性和实用性。  相似文献   

2.
针对Naive Scaler的改进   总被引:1,自引:0,他引:1  
决策表离散化要求决策表中原有的分类结果不变,而NaiveScaler算法在离散化时,有些根据不可分辨关系应该得到的断点很可能被丢掉,造成决策表信息的丢失.针对这一问题,对其进行了研究并改进.原算法在扫描相同条件属性值而决策值不同的对象时,由于这些对象的排序不同可能造成离散的结果不同.主要是在这里某些断点可能被遗漏,并引进新的冲突.为此,当条件属性值变化时查看其决策属性值,若有不同决策属性值则追加断点以消除断点被丢掉的可能.进而使得到的初始断点集更可靠.最后给出实例表明该算法有效.  相似文献   

3.
针对新能源智能车监控数据中包含过多的连续属性,提出了一种基于分辨矩阵和信息增益率的有监督离散化算法,从而降低连续属性的取值精度,使得新能源智能车后续的分类模型建立更具泛化能力.该算法在保证分类效果的前提下,获得尽可能少的结果断点,主要从3个方面对传统的离散化算法进行优化,一是根据决策表的条件属性与决策属性构建候选断点分辨矩阵,通过分辨矩阵判断相邻属性取值之间是否有可能的断点;二是用信息增益率来优化结果断点的选取;三是通过设定停止阈值解决了传统算法因停止条件过于严格导致算法选取过多的结果断点、离散化效果一般的问题.实验结果表明,改进的算法能够有效减少断点数量,大幅提高计算效率,并获得与经典算法相近的离散结果.  相似文献   

4.
粗集理论中连续属性的广义离散化   总被引:3,自引:0,他引:3  
提出一种处理区间属性值离散化问题的新方法,其特点是在离散化过程中强调类别可分离性,首先拓展已有的基于断点划分的离散化定义,给出基于类别可分离性的广义离散化定义;然后描述了广义离散化算法并进行时间复杂性分析;最后利用辐射源信号进行了仿真实验.结果表明,该方法能有效离散区问属性决策系统,简化分类器的设计和提高识别率,从而拓展了粗集理论的应用范围.  相似文献   

5.
粗糙集理论中基于遗传算法的离散化方法   总被引:9,自引:2,他引:7  
离散化在粗糙集的实际应用中有重要的意义,它使得粗糙集有更广泛的应用范围。粗糙集中的离散化要求在保持原来决策系统的不可分辩关系情况下,用尽量少的断点进行离散化。文章针对该问题提出了一种遗传算法,将最小断点集作为优化目标,并构造一个新的算子来保证所选断点能保持原决策系统的不可分辩关系,同时相应地采用自适应变异策略。最后对实例进行了求解。  相似文献   

6.
针对不完备信息系统提出了一种新的粗糙集离散化算法。通过分析候选断点与决策类之间的影响关系,定义了候选断点对决策类的区分能力,并以此作为断点重要性的度量,实现不完备信息系统中连续属性的离散化。仿真实验验证了该算法的有效性。  相似文献   

7.
基于粗集理论的数据离散化方法   总被引:21,自引:0,他引:21  
对后继阶段的机器学习或数据挖掘过程而言,决策系统中连续属性值的离散化具有非常重要的意义。本文系统地研究了基于粗集理论的数据离散化方法:提出一种计算候选断点集合的算法;定义概念“选择概率”来合理、有效地度量和区分候选断点的相对重要性;最后基于这一概念提出一种确定结果断点子集的启发式算法,理论分析及仿真结果表明,算法的综舍性能优于文献报道的同类算法.  相似文献   

8.
在分辨矩阵的属性约简算法的研究中,需比较决策系统中各对象生成矩阵元素,导致所得分辨矩阵过于庞大,且造成较大的时间开销.为降低利用分辨矩阵求取属性约简算法的复杂度,依据条件等价类将原决策系统分解为一相容对象集与一非相容对象集,给出条件相对于决策的可辨识关系定义与改进的分辨矩阵定义,将条件相对于决策的可辨识关系变化作为属性约简的判定标准,结果证明改进分辨矩阵的属性约简与保持正域不变的属性约简等价.推理证明与仿真实例说明,改进方法的高效性与完备性.  相似文献   

9.
一种改进的快速数据离散化算法   总被引:1,自引:0,他引:1  
提出一种新的基于粗糙集理论的快速数据离散化算法FRSBD(Fast Rough Set based Discretization Algorithm),文章定义了属性决策关系矩阵等概念.证明了一组基于属性决策关系矩阵的断点判定规则的有效性,并基于该新的断点判定规则,实现了决策表中连续属性值的快速离散化.理论分析说明了FRSBD的正确性和有效性,仿真结果表明该算法优于文献报道的同类算法.  相似文献   

10.
决策系统中连续属性的离散化,即实型属性空问向整型属性空间的映射,它是对决策表中属性约简的第一步.针对多值决策属性的决策信息系统,提出一种新的属性离散化算法.首先根据决策属性的不同,将条件属性集划分为不同的序列,对每两个序列求取候选断点,最后,综合所有的候选断点即为所求的候选断点集合;然后在基于条件属性重要度和贪心算法的基础上提出一种确定结果断点子集的新启发式算法.实例验证了本文所提出的算法能够取得较理想的连续属性离散化结果.  相似文献   

11.
离散格的一种启发式搜索算法   总被引:1,自引:0,他引:1  
通过定义离散化方案之间的偏序关系以及交、并运算,将各种离散化方案组织成离散格。提出一种搜索离散格的启发式算法,实验表明该算法得到的一致决策表的断点数比已有解更少。  相似文献   

12.
基于信息熵的粗糙集连续属性离散化算法   总被引:60,自引:0,他引:60  
谢宏  程浩忠  牛东晓 《计算机学报》2005,28(9):1570-1574
该文提出了一种新的粗糙集连续属性离散化算法.首先对每一个候选断点定义了信息熵,以此作为对断点重要性的量度,在此基础上给出了断点选择的粗糙集连续属性离散化算法.最后采用多组数据对此算法的性能进行了检验,并与其它算法做了对比实验.实验结果表明此算法是有效的,而且当候选断点个数增多时仍有很高的计算效率.  相似文献   

13.
决策系统中连续属性离散化,即将一个连续属性分为若干属性区间并为每个区间确定一个离散型数值,对后继阶段的机器学习具有重要的意义。首先研究了满足决策系统最优划分的一种计算候选断点集合的算法,然后在基于条件属性重要度和贪心算法的基础上提出了一种确定结果断点子集的新启发式算法。所提出的属性离散算法考虑并体现了粗糙集理论的基本特点和优点,并能取得较理想的连续属性离散化结果。  相似文献   

14.
决策表中连续属性离散化,即将一个连续属性分为若干属性区间并为每个区间确定一个离散型数值。该文提出一种新的决策表连续属性离散化算法。首先使用决策强度来度量条件属性的重要性,并据此对条件属性按照属性重要性从小到大排序,然后按排序后的顺序,考察每个条件属性的所有断点,将冗余的断点去掉,从而将条件属性离散化。该算法易于理解,计算简单,算法的时间复杂性为O(3kn2)。  相似文献   

15.
王广正 《微机发展》2008,(11):100-102
企业财务危机预测是非线性预测,各个影响因素之间又存在着复杂的组合决策关系,并且现实中的数据多为连续的,很难直接用于机器分类学习。因此文中从分析财务预警问题的特点出发,融合了智能软计算的多种方法建立完整的预测模型。首先以粗糙集决策表一致性水平、区间平均信息熵、离散化程度等因素为离散化结果的评价标准;然后利用遗传算法全局、并行搜索的优点,以上面提到的3个因素作为启发信息对所有条件属性的割点集合进行最优搜索。得到离散化的数据后,用BP神经网络对数据进行分类学习。最终网络学习训练后对企业财务状况进行了预测,实验结果表明:系统的预测正确率达93%。  相似文献   

16.
一种基于信息论的决策表连续属性离散化算法   总被引:2,自引:0,他引:2  
连续属性离散化方法对后续阶段的机器学习和数据挖掘过程有着重要的意义。提出一种新的针对决策表的离散化算法,在该算法中,首先将信息熵用作判断标准,从候选断点集中选择合适的断点,然后删除一些冗余的断点来优化离散结果,在删除过程中为了尽可能保证决策表分类能力不变,使用不一致率对该过程进行控制。最后选取多组实验数据,使用当前流行的分类算法——支持向量机(SVM)对离散化后的数据进行分类预测,并与其它离散算法进行对比,结果表明本算法是有效的。  相似文献   

17.
提出一种基于改进粒子群的连续属性离散化算法。该算法结合集群智能优化理论和粗糙集理论,将各属性离散化分割点初始化为粒子群体,通过粒子间的相互作用寻求最优离散化分割点。将提出的离散化算法应用于UCI数据集实验中,实验结果表明,该算法能使决策系统的信息损失降低到最小,并可获取更为简洁的决策规则。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号