首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 356 毫秒
1.
对基于信息论的离散化系列算法进行了分析,在此基础上提出了一种新的连续属性离散化方法。该算法使用信息偏差来对断点重要性进行度量,在离散化过程中使用不一致率进行控制以保证决策表的相容性不发生变化。最后通过使用C4.5和支持向量机(SVM)对该算法和其他算法进行性能对比,验证了该算法的有效性。  相似文献   

2.
针对新能源智能车监控数据中包含过多的连续属性,提出了一种基于分辨矩阵和信息增益率的有监督离散化算法,从而降低连续属性的取值精度,使得新能源智能车后续的分类模型建立更具泛化能力.该算法在保证分类效果的前提下,获得尽可能少的结果断点,主要从3个方面对传统的离散化算法进行优化,一是根据决策表的条件属性与决策属性构建候选断点分辨矩阵,通过分辨矩阵判断相邻属性取值之间是否有可能的断点;二是用信息增益率来优化结果断点的选取;三是通过设定停止阈值解决了传统算法因停止条件过于严格导致算法选取过多的结果断点、离散化效果一般的问题.实验结果表明,改进的算法能够有效减少断点数量,大幅提高计算效率,并获得与经典算法相近的离散结果.  相似文献   

3.
针对Naive Scaler的改进   总被引:1,自引:0,他引:1  
决策表离散化要求决策表中原有的分类结果不变,而NaiveScaler算法在离散化时,有些根据不可分辨关系应该得到的断点很可能被丢掉,造成决策表信息的丢失.针对这一问题,对其进行了研究并改进.原算法在扫描相同条件属性值而决策值不同的对象时,由于这些对象的排序不同可能造成离散的结果不同.主要是在这里某些断点可能被遗漏,并引进新的冲突.为此,当条件属性值变化时查看其决策属性值,若有不同决策属性值则追加断点以消除断点被丢掉的可能.进而使得到的初始断点集更可靠.最后给出实例表明该算法有效.  相似文献   

4.
决策表中连续属性离散化,即将一个连续属性分为若干属性区间并为每个区间确定一个离散型数值。该文提出一种新的决策表连续属性离散化算法。首先使用决策强度来度量条件属性的重要性,并据此对条件属性按照属性重要性从小到大排序,然后按排序后的顺序,考察每个条件属性的所有断点,将冗余的断点去掉,从而将条件属性离散化。该算法易于理解,计算简单,算法的时间复杂性为O(3kn2)。  相似文献   

5.
基于小生境离散粒子群优化的连续属性离散化算法   总被引:1,自引:0,他引:1  
分析了基于粗糙集理论的连续属性离散化的实质,在此基础上提出了一种基于小生境离散粒子群优化的启发式全局离散化算法。该算法结合粗糙集理论,将决策属性支持度作为决策表整体分类能力的度量,然后利用离散粒子群优化算法,以最小断点集和最大决策属性支持度为优化目标,在保持决策表分类能力不变的情况下,通过粒子的迭代寻求最优值;同时为了避免粒子在迭代过程中的早熟收敛问题,引入小生境共享机制,加强了离散粒子群算法的全局搜索能力。通过实验将本文算法与其他算法进行了比较,结果表明采用本文算法得到了较少的断点数,提高了规则的分类正确率,验证了该算法的有效性和稳定性。  相似文献   

6.
曹峰  唐超  张婧 《计算机科学》2017,44(9):222-226
离散化是一个重要的数据预处理过程,在规则提取、知识发现、分类等研究领域都有广泛的应用。提出一种结合二元蚁群和粗糙集的连续属性离散化算法。该算法在多维连续属性候选断点集空间上构建二元蚁群网络,通过粗糙集近似分类精度建立蚁群算法适宜度评价函数,寻找全局最优离散化断点集。通过UCI数据集验证算法的有效性,实验结果表明,该算法具有较好的离散化性能。  相似文献   

7.
提出了一种基于粗糙集和神经网络组合进行规则提取的方法。首先对初始数据集进行离散化,并利用粗糙集对决策表中的条件属性进行初步约简,然后利用神经网络对数据进行学习和预测,并通过删除网络不能分类的数据来对决策表中的噪声进行过滤,最后再由粗糙集值约简算法进行规则提取。实验表明,该方法相对于传统规则提取算法快速有效,在保留神经网络高鲁棒性的同时,避免了从神经网络中提取规则的困难。  相似文献   

8.
针对粗糙集不能较好地处理连续型属性的问题,结合粗糙集理论和粒子群算法,提出基于自适应混合禁忌搜索粒子群的连续属性离散化算法。首先,该算法通过对参数的自适应更新操作,从而避免了粒子群出现早熟的现象;然后将粒子群当代得到的全局最优粒子送入禁忌算法中进行优化,有效地提升了算法的局部探索能力;在兼顾决策表系统一致性的同时,将划分的断点初始化为一群随机粒子,通过改进后粒子群的自我迭代得到最佳的离散化划分点。实验结果表明,与其他结合粗糙集的离散化算法相比,该算法具有更高的规则分类精度和较少的离散化断点个数,对连续属性的离散化效果较好。  相似文献   

9.
连续属性的离散化是粗糙集理论的主要问题之一.针对粗糙集理论只能处理离散数据的局限性,提出基于属性决策表和竞争型网络的连续属性离散化方法.首先使用条件属性与决策属性之间的决策关系来度量条件属性的重要性,并据此对条件属性按照重要性由小到大排序,然后利用竞争型网络分类功能找到连续属性的断点,从而实现了对连续属性的离散化.算法分析和实验证明算法是切实可行的.  相似文献   

10.
一种改进的快速数据离散化算法   总被引:1,自引:0,他引:1  
提出一种新的基于粗糙集理论的快速数据离散化算法FRSBD(Fast Rough Set based Discretization Algorithm),文章定义了属性决策关系矩阵等概念.证明了一组基于属性决策关系矩阵的断点判定规则的有效性,并基于该新的断点判定规则,实现了决策表中连续属性值的快速离散化.理论分析说明了FRSBD的正确性和有效性,仿真结果表明该算法优于文献报道的同类算法.  相似文献   

11.
为解决经典粗糙集理论在处理连续、离散混合属性决策表离散化时规则数多、准确率低的问题,采用基于贪心算法和属性值区间概率相结合的离散化方法,该方法针对传统的对混合决策表仅考虑连续属性离散化的问题。首先运用改进的贪心算法对混合决策表中的连续属性进行初步离散化,然后计算连续属性各属性值区间概率,并对取值概率大的区间细化,最后再考虑对原来的离散属性进一步离散化,从而增强系统分辨能力;且离散化后的决策表总是相容的,与目前很多离散方法不考虑决策相容性相比,该方法能够最大限度地保留系统的有用信息。通过仿真分析验证了该方法的有效性。  相似文献   

12.
连续属性决策表离散化的图论方法   总被引:1,自引:0,他引:1  
通过研究粗糙集与图论的关系,提出了以集合为权的加权多重完全多部图的概念,得到了加权完全多部图与连续属性决策表的映射关系,给出了断点重要性和断点效率的一种新的量化定义并得到了相关性质;提出了连续属性决策表信息系统的图论形式和连续属性决策表离散化的图论方法。编程实验结果证明,应用此方法可以确保在离散化后决策表相容的前提下得到无剩余属性值的较小的断点集合。  相似文献   

13.
基于微粒群优化的连续属性离散化算法   总被引:3,自引:0,他引:3  
连续属性的离散化是粗糙集理论的主要问题之一,也是影响粗糙集理论实用性的瓶颈之一。由于没有最佳离散化形式的统一标准,大多离散化算法采用的启发式带有较强的主观性,也难以得到较满意的离散效果。该文提出了基于微粒群优化的连续属性离散化方法,将各属性的离散化划分点初始化为一群粒子,在保证决策表分类能力不变的情况下,通过粒子间的相互作用寻求理想的离散化划分点,使得决策表引入较少的冲突。实验结果验证了该方法的有效性。  相似文献   

14.
离散格的一种启发式搜索算法   总被引:1,自引:0,他引:1  
通过定义离散化方案之间的偏序关系以及交、并运算,将各种离散化方案组织成离散格。提出一种搜索离散格的启发式算法,实验表明该算法得到的一致决策表的断点数比已有解更少。  相似文献   

15.
We present a method to learn maximal generalized decision rules from databases by integrating discretization, generalization and rough set feature selection. Our method reduces the data horizontally and vertically. In the first phase, discretization and generalization are integrated and the numeric attributes are discretized into a few intervals. The primitive values of symbolic attributes are replaced by high level concepts and some obvious superfluous or irrelevant symbolic attributes are also eliminated. Horizontal reduction is accomplished by merging identical tuples after the substitution of an attribute value by its higher level value in a pre-defined concept hierarchy for symbolic attributes, or the discretization of continuous (or numeric) attributes. This phase greatly decreases the number of tuples in the database. In the second phase, a novel context-sensitive feature merit measure is used to rank the features, a subset of relevant attributes is chosen based on rough set theory and the merit values of the features. A reduced table is obtained by removing those attributes which are not in the relevant attributes subset and the data set is further reduced vertically without destroying the interdependence relationships between classes and the attributes. Then rough set-based value reduction is further performed on the reduced table and all redundant condition values are dropped. Finally, tuples in the reduced table are transformed into a set of maximal generalized decision rules. The experimental results on UCI data sets and a real market database demonstrate that our method can dramatically reduce the feature space and improve learning accuracy.  相似文献   

16.
为了解决数据挖掘和机器学习领域中连续属性离散化问题,提出一种改进的自适应离散粒子群优化算法。将连续属性的断点集合作为离散粒子群,通过粒子间的相互作用最小化断点子集,同时引入模拟退火算法作为局部搜索策略,提高了粒子群的多样性和寻找全局最优解的能力。利用粗糙集理论中决策属性对条件属性的依赖度来衡量决策表的一致性,从而达到连续属性离散化的目的,最后采用多组数据对此算法的性能进行了检验,并与其他算法做了对比实验,实验结果表明此算法是有效的。  相似文献   

17.
粗集理论中连续属性的广义离散化   总被引:3,自引:0,他引:3  
提出一种处理区间属性值离散化问题的新方法,其特点是在离散化过程中强调类别可分离性,首先拓展已有的基于断点划分的离散化定义,给出基于类别可分离性的广义离散化定义;然后描述了广义离散化算法并进行时间复杂性分析;最后利用辐射源信号进行了仿真实验.结果表明,该方法能有效离散区问属性决策系统,简化分类器的设计和提高识别率,从而拓展了粗集理论的应用范围.  相似文献   

18.
Rough Set理论中连续属性的离散化方法   总被引:95,自引:0,他引:95  
苗夺谦 《自动化学报》2001,27(3):296-302
Rough Set(RS)理论是一种新的处理不精确、不完全与不相容知识的数学工具.传 统的RS理论只能对数据库中的离散属性进行处理,而绝大多数现实的数据库既包含了离散 属性,又包含了连续属性.文中针对传统RS理论的这一缺陷,利用决策表相容性的反馈信 息,提出了一种领域独立的基于动态层次聚类的连续属性离散化算法.该方法为RS理论处 理离散与连续属性提供了一种统一的框架,从而极大地拓广了RS理论的应用范围.通过一 些例子将本算法与现有方法进行了比较分析,得到了令人鼓舞的结果.  相似文献   

19.
通过研究飞机快速存取记录器(Quick Access Recorders,QAR)数据和粗糙集理论的特点,结合信息决策表的相关知识,对QAR数据中的异常数据进行检测挖掘,以辅助飞机故障检测及排除。主要工作是:应用粗糙集理论特点对QAR数据进行离散化,并建立离散化后数据的决策表,然后对决策表进行属性约简和规则提取。根据QAR数据的特殊性,给出了数据离散化和决策表属性约简的改进算法。最后通过对比项目实验及专家给出的数据证明了其可行性和有效性,提高了飞机排故效率,具有很重要的现实意义。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号