首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 250 毫秒
1.
基于信息增益的属性约简算法   总被引:1,自引:0,他引:1  
以信息增益作为属性重要性的度量方法,提出了一种基于信息增益的属性约简算法.该算法总是优先考虑对于决策更为重要的属性,用条件属性对决策属性的信息增益作为条件属性的属性重要性度量,并以此度量作为启发式信息,算法从空集开始逐步将重要的属性加入到选择属性集,直到决策表达到一致分类时结束.并通过实例分析验证了该算法能有效地对属性进行约简,同时可以得到简单规则集.  相似文献   

2.
属性约简是粗糙集理论研究的关键问题之一,针对Rough Sets理论的属性约简进行了研究.首先,介绍了可辨识矩阵属性约简的基本算法,并根据GENRED属性约简算法提出一种新的基于粗糙集的属性约简算法,证明了该算法在满足约简结果要求的同时,又能够提高算法的运行效率.  相似文献   

3.
以信息增益作为属性重要性的度量方法,提出了一种基于信息增益的属性约简算法.该算法总是优先考虑对于决策更为重要的属性,用条件属性对决策属性的信息增益作为条件属性的属性重要性度量,并以此度量作为启发式信息,算法从空集开始逐步将重要的属性加入到选择属性集,直到决策表达到一致分类时结束.并通过实例分析验证了该算法能有效地对属性进行约简,同时可以得到简单规则集.  相似文献   

4.
以面向对象的软件度量为研究对象,首先采用SOM神经网络离散化度量元因子矩阵数据,接着对于得到的离散化的矩阵数据采用粗糙集理论的属性约简算法进行属性约简,然后根据约简得到规则构造模糊神经网络的网络结构,并采用BP算法对网络进行训练,最后通过仿真实验验证了该算法。  相似文献   

5.
阐述了粗糙集理论和信息熵的概念,在此基础上提出了一种基于信息熵的属性约简算法。该算法从相对核的角度出发,将信息熵、条件信息熵和属性的重要度结合运用,优化了算法的结构,同时加快了决策表的运行速度。用CTR和Wine数据集对提出的算法进行了实验验证。结果表明,该算法能获得决策系统的最优属性约简,同时加快了运行速度。  相似文献   

6.
针对基于邻域粗糙集属性重要度约简算法在某些决策表中约简正确率下降等问题,结合基于等价关系下的分辨矩阵知识,定义一种邻域决策系统下的分辨矩阵,邻域分辨矩阵由能够分辨不同邻域对象的条件属性子集组成。根据条件属性在邻域分辨矩阵中的占比提出一种属性重要度的度量方法,以新的重要度作为启发性因子,设计一种邻域决策系统下属性重要度启发性约简算法。该算法以核属性集作为初始集合,依次选择重要度大的属性加入到核集,直至找到最小属性约简时,算法终止。实例分析和UCI数据集试验结果表明,与基于属性依赖度的约简算法相比,该算法能够更有效地找到最小属性约简集,并且可以有效减少计算工作量,证明了算法的有效性和可实用性。  相似文献   

7.
为获取连续属性值数据集的最小属性子集,提出了一种两步约简方法.该方法以模糊粗糙集模型为基础,将描述条件属性和决策属性依赖关系的模糊依赖度概念进行了扩展,使其能对条件属性之间的依赖关系进行度量,利用属性与类别之间的依赖度选出候选属性集,然后根据单个属性与类别和属性之间的依赖度对候选属性集进行约简.仿真结果表明,该方法在有效降低属性维数的同时一定程度上保证了分类正确率.  相似文献   

8.
粗糙集理论中一种属性离散化算法   总被引:6,自引:0,他引:6  
针对定量属性离散化制约粗糙集理论应用这一关键问题,利用分级聚类法和粗糙集理论中依赖度的概念,提出了一种对决策系统中条件属性进行离散化的增类减类算法,实现了决策系统的属性约简。该算法易于理解,计算简单,以实例说明了算法的合理性和有效性。  相似文献   

9.
针对启发式算法获取最小约简的局限性,提出了一种基于变精度粗糙集理论的获得最小约简的新方法。该方法是将信息系统的所有属性约简以及每个约简的参数β范围结合起来考虑,从中选出所含属性个数最少而且参数β范围最大的约简,作为最小约简。同时给出了相应的求得所有约简及其参数β范围的算法,并且通过MATLAB进行了实现,结果表明以上算法对于条件属性较少的信息系统十分有效。最后通过算例说明所给方法的有效性及可行性。  相似文献   

10.
相似事例检索算法是计算机辅助复合材料成型工艺设计中的关键技术。研究了事例推理机制,给出了基于粗糙集理论的事例推理流程,对相似事例算法进行改进,采用粗糙集理论中属性重要性对事例索引属性进行约简,约简掉对检索结果影响较小的属性,并采用粗糙集属性重要性理论确定索引属性的权值。研究了索引属性中数值类型和集合类型的相似性计算算法,最后通过实例对算法进行验证,结果表明该算法提高了事例检索的速度和正确性。  相似文献   

11.
基于粗集理论的数据约减算法及其改进   总被引:4,自引:0,他引:4  
在分析基于信息系统的粗糙集理论的基础上,详细地描述了一种基于核的约减算法,接着从降低约减算法计算复杂度角度出发,提出度量单个条件属性对系统概念贡献程度的关联度的概念,修改了属性约减算法,并简要计算算法修改前后计算复杂度,实验结果表明,修改后的算法在降低时间复杂度的同时能求出次优属性集约简.  相似文献   

12.
一种基于粗糙集的K-means聚类算法   总被引:2,自引:0,他引:2  
对粗糙集进行了相关研究,并提出了一种以粗糙集理论为基础的K-平均聚类算法,该算法以信息表中条件属性和决策属性的一致性原理为基础,应用粗糙集的属性约简算法消除冗余属性,利用各属性重要度确定其权值,在此基础上应用改进的K-平均算法进行聚类分析.该方法的优势在于消除了不重要的属性,赋予了各属性权值,使聚类更有效,更客观.实验结果表明,该方法是有效的.  相似文献   

13.
A support vector machine time series forecasting model based on rough set data preprocessing was proposed by combining rough set attribute reduction and support vector machine regression algorithm. First, remove the redundant attribute for forecasting from condition attribute by rough set method; then use the minimum condition attribute set obtained after the reduction and the corresponding initial data, reform a new training sample set which only retain the important attributes influencing the forecasting accuracy; study and train the support vector machine with the training sample obtained after reduction, and then input the reformed testing sample set according to the minimum condition attribute and corresponding initial data. The model was tested and the mapping relation was got between the condition attribute and forecasting variable. Eventually, power supply and demand were forecasted in this model. The average absolute error rates of power consumption of the whole society and yearly maximum load are respectively 14.21% and 13.23%. It shows that RS-SVM time series forecasting model has high forecasting accuracy.  相似文献   

14.
针对属性特别多仅用一种属性约简方法难以实现有效约简的情况,提出了基于双重属性约简的混合支持向量机分类方法.通过引入贡献率和正确率两个概念,首先采用主成分分析算法计算各个条件属性的贡献率,根据贡献率大小和给定的阈值去掉条件属性中贡献率小的成分,提取信息量最大的主要成分;然后再基于粗糙集的属性约简理论,计算这些主要成分对决策变量的正确率,对这些属性进行第二次约简;该方法采用定性定量相结合的方式,可以最大程度地去除属性集中冗余的或不重要的属性,保证将最简的属性样本集输入支持向量机进行建模预测.最后的仿真试验验证了我们所提方法的有效性和正确性.  相似文献   

15.
一种基于互信息增益率的新属性约简算法   总被引:13,自引:1,他引:13  
为了获得决策系统中更好的相对属性约简,提出了一种基于互信息增益率的属性约简算法.该算法考虑了所选择条件属性与决策属性的互信息,还考虑了所选择属性的值的分布情况,从信息论角度定义了基于互信息增益率的属性重要性度量方法,并以此度量为启发式信息,算法从空集开始逐步将最重要的条件属性加入到选择属性集,直到所选择的条件属性集与决策属性集的互信息等于整个条件属性集与决策属性集的互信息时,算法停止.结果表明,算法能更有效地对决策系统进行约简,同时约简后的对象数目较少.  相似文献   

16.
A support vector machine (SVM) forecasting model based on rough set (RS) data preprocess was proposed by combining the rough set attribute reduction and the support vector machine regression algorithm, because there are strong complementarities between two models. Firstly, the rough set was used to reduce the condition attributes, then to eliminate the attributes that were redundant for the forecast, Secondly, it adopted the minimum condition attributes obtained by reduction and the corresponding original data to re-form a new training sample, which only kept the important attributes affecting the forecast accuracy. Finally, it studied and trained the SVM with the training samples after reduction, inputted the test samples re-formed by the minimum condition attributes and the corresponding original data, and then got the mapping relationship model between condition attributes and forecast variables after testing it. This model was used to forecast the power supply and demand. The results show that the average absolute error rate of power consumption of the whole society and yearly maximum load are 14.21% and 13.23%, respectively, which indicates that the RS-SVM forecast model has a higher degree of accuracy.  相似文献   

17.
针对Rough Sets理论的属性约简进行了研究.引入了决策属性集相对于条件属性集的条件信息量的概念,证明了条件信息量在属性约简过程中的变化规律是单调递减的,并利用其计算属性集中属性间的相关性,其平均值最小的属性集即为最后属性约简的结果,由此,提出了一种新的基于信息量的属性约简算法.  相似文献   

18.
粗糙集理论在关键功能零件识别中的应用   总被引:1,自引:0,他引:1  
关键功能零件的识别可以提高装配体模型检索的效率并提高重用水平,同时为自主设计提供关键参考信息.为降低人为因素的影响和评价的主观性,本文提出了一种基于粗糙集理论的关键子装配功能零件的自动识别方法,利用装配体模型自身数据对功能零件的排序过程进行驱动.分析、讨论复杂装配体中零件类型与零件之间的装配连接关系,构建了基于复杂网络...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号