首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
在现实决策中,代价敏感问题是影响人类决策的重要因素之一,许多研究者致力于降低决策的代价。现阶段,在粗糙集领域中,研究者多基于DTRS模型且仅考虑某一种代价,不够全面。针对以上问题,利用序贯三支决策模型对两种代价的敏感性,通过多层次粒结构可以有效降低决策总代价,且能够更好地模拟人类动态渐进的决策过程。在序贯三支决策模型的基础上,构造了多层次粒结构;将各个属性的测试代价与其分类能力相关联,从信息熵的角度为其设置测试代价;与此同时,将属性约简与序贯三支决策相结合,利用基于代价最小准则的属性约简去除冗余属性及不相关属性对代价的影响。在7个UCI数据集上的实验结果显示,在保证较高准确度的同时,决策的总代价平均下降了26%左右,充分验证了该方法的有效性。  相似文献   

2.
为了解决当不完备混合决策系统中数据动态增加时,静态属性约简方法的计算复杂度高的问题,提出变精度下不完备混合数据的增量式属性约简方法。首先,在变精度模型下给出了利用条件熵度量属性的重要性程度;然后,详细分析和设计了当数据动态增加时条件熵的增量式更新变化情况和属性约简的更新机制;在此基础上,利用启发式贪心策略构造了增量式的属性约简算法,实现了不完备的数值型和符号型混合数据下属性约简的动态更新。通过UCI数据集中五个真实的混合型数据集的实验比较和分析,在约简效果方面,利用增量式属性约简算法处理Echocardiogram、Hepatitis、Autos、Credit和Dermatology数据集的增量规模为90%+10%时,数据集的原属性个数分别由12、19、25、17和34个约简至6、7、10、11和13个,分别占原属性集的50.0%、36.8%、40.0%、64.7%和38.2%;在执行时间方面,增量式算法在五个数据集的平均耗时分别为2.99 s、3.13 s、9.70 s、274.19 s和50.87 s,静态算法的平均耗时分别为284.92 s、302.76 s、1062.23 s、3510.79 s和667.85 s,且增量式算法的耗时与数据集的实例规模、属性个数和属性值类型的分布相关。实验结果表明,增量式属性约简算法在计算耗时方面要显著优于静态算法,且能有效剔除数据中的冗余属性。  相似文献   

3.
为了获得决策表中更好的属性约简,提出一种信息增益引导的蜂群优化算法;该算法以属性的信息熵为基础构造条件属性与决策属性间的互信息,用待选条件属性引起的信息增益作为引导蜜蜂搜索的启发信息,最终求得属性约简集;对UCI数据库多个数据集的测试结果表明,与其它基于群智能的属性约简算法相比,该算法获得最小属性约简的机率提高到90%以上,同时较对比算法的计算时间少耗费至少10%。  相似文献   

4.
面向大规模的数据进行知识约简是近年来粗糙集理论研究的热点。传统不完备信息系统的知识约简是假设在初始时将所有需要处理的数据一次性地装入内存中,这明显不适合处理海量数据,更不适合处理含有缺失信息的海量数据。为此,深入剖析了带有缺失信息的数据特征,把缺失属性的值用该属性所有可能的取值表示,并结合知识约简算法中的可并行性,从属性(集)的可辨识性和不可辨识性出发,并在MapReduce框架下设计了可用来处理不完备信息系统的知识约简算法。实验结果表明,该算法是有效可行的,能够对不完备信息系统中的海量数据进行知识约简。  相似文献   

5.
为了考虑专家评价值之间的内在联系和拓展决策模型的使用范围,构建了基于毕达哥拉斯模糊几何Bonferroni平均(PFGBM)的多属性决策方法。该方法首先在毕达哥拉斯模糊信息环境下,通过阿基米德范数定义了新的加法、乘法、数乘以及幂运算;随后结合几何Bonferroni平均提出了PFGBM,分析了PFGBM的基本特征性质和常用的PFGBM表达形式;最后设计了基于PFGBM的决策模型,并运用提出的决策模型来处理云计算产品的更新选择实例中。实验表明,构建的模型提高了决策的适用范围和灵活性。  相似文献   

6.
熊方  张贤勇 《计算机应用》2016,36(11):2954-2957
采用二分类情形与三支决策区域,研究变精度粗糙集(VPRS)两类属性约简及其结构启发算法。首先,依托三支决策区域构建分类区域,提出分类区域保持(CRP)约简与决策区域保持(DRP)约简,得到对定性属性约简的量化扩张性,设计基于核的结构启发算法;然后,研究两类区域约简的强弱关系,设计由强至弱的结构启发算法,得到二支决策拓展为三支决策的约简改进;最后,利用数据表实例与UCI数据集验证区域约简及其启发算法的有效性。  相似文献   

7.
邻域粗糙集模型在处理完备的数值型数据中得到广泛应用,但针对不完备的数值型和符号型混合数据进行属性约简的讨论相对较少。为此,首先结合邻域粗糙集给出了可变精度模型下不完备邻域决策系统的上、下近似算子及属性约简;然后通过邻域粒化的方法构建了广义邻域下可变精度的粗糙集模型,并提出了一种属性重要度的评价方法;在此基础上,设计出了面向不完备邻域决策系统的属性约简算法,该算法可直接处理不完备的数值型和符号型混合数据;最后,通过实例分析验证了本文提出的算法能够求解出变精度下不完备邻域决策系统的属性约简结果。  相似文献   

8.
罗世华  方童  刘俊 《控制与决策》2021,36(5):1249-1258
在概率区间值直觉犹豫模糊集(PIVIHFS)的基础上,引入Maclaurin对称平均算子和Archimedean范数,构建一种基于概率区间值直觉犹豫模糊Maclaurin对称平均(PIVIHFMSM)算子的多属性决策模型,用来刻画决策专家输入多个参数值的决策信息,决策者可根据风险偏好等主观意识选择合适的参数值进行决策,同时能保证决策信息的有效性和完整性,避免决策过程中的不确定性和决策信息缺失问题.首先,回顾PIVIHFS的定义和排序方法以及Archimedean范数;其次,提出概率区间值直觉犹豫模糊Maclaurin对称平均(PIVIHFMSM)算子,研究其优良性质及常见形式;最后,提出一种基于PIVIHFWMSM算子的多属性决策方法,并进行比较分析,通过实例验证该方法的可行性和有效性.拓展PIVIHFS理论和应用领域,为决策属性具有相关性和决策信息有可能缺失提供新思路.  相似文献   

9.
属性约简是粗糙集理论的核心问题,为了获得更多更稳定的最小属性约简,根据决策粗糙集模型将最小属性约简问题转化为决策风险最小化问题,并给出了新的适应度函数计算方法;在此基础上利用回溯搜索算法较强的全局搜索性能,提出了基于回溯搜索算法的决策粗糙集属性约简算法;对UCI数据集的实验结果以及与其他约简算法的比较表明,该算法能够得到更多的最小属性约简,而且能够在多次运行中保持约简结果个数的稳定性。  相似文献   

10.
属性约简是粗糙集理论的重要研究内容.目前决策粗糙集的属性约简大多基于全局的决策类,并且都是采用单一的约简准则.针对这一问题,在决策粗糙集下提出一种特定类别属性约简算法.针对特定的决策类,给出一种属性约简的定义,在保证决策区域极大化的同时尽可能地降低决策区域划分时的代价;利用集成学习的方法设计出相应的启发式属性约简算法.通过在UCI数据集上与已有的算法进行实验比较,验证了该算法具有更高的属性约简性能.  相似文献   

11.
针对现有的决策形式背景属性约简方法不能处理多粒度数据的问题,文中提出3种多粒度决策形式背景的属性约简方法,目的是通过删除每个协调粒度层下相同类别的类属性块,实现信息系统的属性约简.首先从信息粒的角度出发,在多粒度决策形式背景中引入协调粒度层的信息熵及条件信息熵,利用它们进一步度量属性重要度.然后,在多粒度决策形式背景中基于平均条件信息熵、最粗协调决策形式背景条件信息熵及最细协调决策形式背景条件信息熵,提出协调粒度约简方法、最粗协调粒度约简方法、最细协调粒度约简方法及其实现算法.最后,通过实验验证文中提出的3种属性约简方法的有效性,对比这3种方法得到的属性约简集,发现协调粒度约简方法的约束条件较严,相比之下,最粗协调粒度约简方法和最细协调粒度约简方法约束条件相对宽松.  相似文献   

12.
针对基于正域的属性约简算法在约简过程中存在重复计算属性相对重要度从而导致算法效率低的问题,从属性度量和搜索策略的角度提出基于知识粗糙熵的快速属性约简算法。首先,在决策信息系统中通过引入知识距离提出知识粗糙熵以度量知识的粗糙程度;其次,利用知识粗糙熵作为属性显著度的评价标准来评估单个属性的重要程度;最后,利用属性重要度对所有条件属性进行排序,且通过属性依赖度删除冗余属性,从而实现快速约简。在六个公开数据集上将所提算法与其他三种算法在运行效率和分类精度上进行对比实验。结果表明,该算法的运行效率比其他三种算法分别提高了83.24%、28.77%和59.92%;在三种分类器中,分类精度分别平均提高了0.83%、0.63%和1.37%。因此,所提算法在保证分类性能的同时,能以更快的速度获得约简。  相似文献   

13.
在粗糙集理论中,属性约简是重要的研究内容之一。通过属性约简可以去除冗余属性,求得保持决策系统某种分类能力不变的最小属性子集。分布约简保持决策系统中所有决策类的分布不变,但针对所有决策类的分布约简在实际问题中可能是不必要的。针对以上问题,文中给出了区间值决策系统中基于α-相容关系的特定类分布约简的概念,证明了特定类分布约简的相关定理,构造了特定类分布约简对应的差别矩阵,提出了基于差别矩阵的特定类的分布约简算法(CDRDM),并分析了特定类的分布约简算法和全局分布约简算法(DRDM)构造的差别矩阵中非空元素的集合之间的关系。实验中选取了6组UCI数据集,引入了区间参数,当区间参数为1.2、阈值为0.5时,比较了DRDM算法和3种不同决策类下的CDRDM算法的约简结果和平均约简长度,并且当区间参数分别为1.2和1.6、阈值分别为0.4和0.5时,给出了DRDM算法和两种不同决策类下的CDRDM算法的约简时间随着对象数目和属性数目的变化情况。实验结果表明,特定类分布约简算法针对不同决策类的约简结果可能不同,并且当决策系统中的决策类数量大于1时,特定类分布约简算法的平均约简长度小于或等于全局分布约简算法的平均约简长度,特定类分布约简算法针对不同的决策类在约简效率上有不同程度的改进。  相似文献   

14.
当前区间类型数据的规模越来越大,若采用传统的属性约简方法进行处理,就需要对数据进行预处理,而这会损失原始信息。针对上述问题,提出了区间值决策系统β分布的约简算法。首先,给出区间值决策系统β分布的概念和约简目标,并证明了提出的相关定理;然后,对于该约简目标构建了β分布约简的差别矩阵和差别函数,提出了区间值决策系统β分布约简算法;最后,使用14组UCI数据集进行实验验证。在数据集Statlog上,当相似度阈值为0.6,对象数目为100、200、400、600、846时,β分布约简算法的平均约简长度为1.6、2.2、1.4、2.4、2.6,基于差别矩阵的分布约简算法(DRADM)的平均约简长度为2.0、3.0、3.0、4.0、4.0,基于差别矩阵的最大分布约简算法(MDRADM)的平均约简长度为2.0、3.0、3.0、4.0、3.0。实验结果验证了所提β分布约简算法的有效性。  相似文献   

15.
针对现有三支决策模型的研究对象多为单一性数据的决策系统,对于混合数据边界域样本处理的研究相对较少,本文面向混合数据提出了基于核属性的代价敏感三支决策边界域分类方法。该方法基于正域约简计算混合邻域决策系统的核属性集,在此基础上计算混合邻域类,并利用三支决策规则分别将对象划分到各决策类的正域、边界域和负域;提出了一种基于代价敏感学习的三支决策边界域分类方法,并构造了误分类代价的计算方法,以此划分边界域中的对象。通过对UCI上的10个数据集进行实验对比与分析,进一步验证了本文方法,为处理边界域样本提供了一种可行有效的方法。  相似文献   

16.
属性约简是粗糙集理论的核心内容之一。通过对多种约简方法进行比较,为了得到更好的结果,在传统基于属性依赖度的约简方法基础上,定义更精确的强化正域概念。通过对边界域的精确划分,得出各条件属性对决策属性的强化依赖度,并用自顶向下的启发式搜索算法得到约简结果。采用UCI标准数据集对基于强化正域约简方法REPR进行测试,约简数据后构建的决策树规模小,分类精度高。实验结果表明,相比于经典方法,REPR能更有效地对决策表进行属性约简。  相似文献   

17.
赵冬梅  李红 《计算机应用》2017,37(4):1008-1013
网络安全态势要素选取的质量对网络安全态势评估的准确性起到至关重要的作用,而现有的网络安全态势要素提取方法大多依赖先验知识,并不适用于处理网络安全态势数据。为提高网络安全态势要素提取的质量与效率,提出一种基于属性重要度矩阵的并行约简算法,在经典粗糙集基础上引入并行约简思想,在保证分类不受影响的情况下,将单个决策信息表扩展到多个,利用条件熵计算属性重要度,根据约简规则删除冗余属性,从而实现网络安全态势要素的高效提取。为验证算法的高效性,利用Weka软件对数据进行分类预测,在NSL-KDD数据集中,相比利用全部属性,通过该算法约简后的属性进行分类建模的时间缩短了16.6%;对比评价指标发现,相比现有的三种态势要素提取算法(遗传算法(GA)、贪心式搜索算法(GSA)和基于条件熵的属性约简(ARCE)算法),该算法具有较高的召回率和较低的误警率。实验结果表明,经过该算法约简的数据具有更好的分类性能,实现了网络安全态势要素的高效提取。  相似文献   

18.
对于属性信息之间有着一定关系并且属性值为犹豫模糊元的问题,运用提出的犹豫模糊Maclaurin几何对称平均(HFMGSM)算法,建立了一种新的多属性群决策模型,该模型可以依据决策者偏好而选择合适参数值进行决策。首先,结合Archimedean范数引入了新的犹豫模糊运算;其次,以Maclaurin几何对称平均为基础,设计了HFMGSM算子,随后研究了HFMGSM算子具有的几种性质特性,分析了HFMGSM算子的几种特殊情况;最后,在犹豫模糊信息环境下,运用HFMGSM算子构建了一种新颖的多属性群决策模型,并通过物流企业选择实例进行验证分析。  相似文献   

19.
为了寻找一种有效的最小属性约简方法,给出了条件属性集上的属性重要度序关系,基于此序关系构建了属性集上的集合枚举树,提出了一种快速的最小属性约简算法,该算法采用至上而下、层次优先策略搜索集合枚举树寻找属性最小约简。为了提高算法性能,该算法采用核和父集剪枝策略减少搜索空间,采用优化计算来确保同一集合的正域只计算一次。基于UCI数据的实验结果表明,该算法是有效的。  相似文献   

20.
针对动态Web组合中经常出现QoS数据信息丢失、出错等现象,提出在没有先验知识且数据信息不完备的情况下,利用粗糙集理论进行QoS驱动的Web服务选择的方法。首先将服务选择问题建模为多属性决策模型,根据Web服务应用环境及数据特点,选择适用的数据预处理方法(数据补齐、离散化、属性约简等),在粗糙集理论生成的规则集基础上,提出基于权重排序的服务选择方法。最后以一组具有不完备属性信息的Web订票服务为实验数据,证明提出的服务选择方法有效。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号