首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 337 毫秒
1.
集合覆盖问题的数据约简研究*   总被引:1,自引:0,他引:1  
针对当前解决大规模集合覆盖问题的算法普遍存在着效率不高的问题,提出了一套削减数据规模的约简方法,并给出了一个能够与其他所有解决集合覆盖问题算法相结合的约简算法。用Beasley提出的45个测试用例进行试验,结果显示贪心算法和遗传算法在结合了约简算法后能够在更少的时间内得到更优的解,表明该约简方法和约简算法可以有效提高传统算法和智能算法解决大规模集合覆盖问题的效率。  相似文献   

2.
粗糙集理论(RST)中,求解最小属性约简MAR (minimal attribute reduction)是一种NP-难(non-deterministic polynomialhard)组合优化问题.蚁群优化算法ACO(antcolonyoptimization)是进化算法中的一种启发式全局优化算法,粗糙集理论与ACO相结合,是求解属性约简的一种有效、可行的方式.针对蚁群优化算法易于陷入局部最优解、收敛速度慢等问题,首先以一种改进的信息增益率作为启发信息,提出了冗余检测机制,对每个被选属性和每代最优约简集合进行冗余检测,并提出了概率提前计算机制,可避免每只蚂蚁在搜索过程中相同路径上的信息反复计算;针对大数据集的属性约简问题,考虑到蚁群优化算法具有并行能力以及粗糙集中“等价类”计算的可并行性,提出一种将ACO与云计算相结合用于求解大数据集的属性约简算法,在此基础上,进一步提出一种多目标并行求解方案.该方案可以同时计算出其余属性相对于当前属性或约简集合的重要度.实验结果表明,该算法在处理大数据的情况下能够得到最小属性约简,计算属性重要度的时间复杂度由O(n2)降至O(|n|).  相似文献   

3.
基于遗传算法的误差因子粗糙集模型   总被引:2,自引:0,他引:2  
粗糙集方法是数据挖掘的重要方法之一.针对当前粗糙集属性约简启发式方法的不足,本文提出了一个基于遗传算法的误差因子粗糙集模型.通过融合遗传算法,消除属性简约中约简属性相对集中的问题.通过引入误差因子,消除噪声数据的影响.利用关系型数据库的关系演算实现了算法,克服了基于文本方法的不足.通过一个舍有噪声的决策表实验,表明该模型是一个有效的算法改进.  相似文献   

4.
关于属性约简和集合覆盖问题的探讨   总被引:9,自引:1,他引:9  
论文探讨了粗糙集的属性约简和集合覆盖问题之间的联系。通过构造信息系统的相关矩阵将粗糙集的属性约简问题与集合覆盖问题联系起来,从而将粗糙集的属性约简问题简化为集合覆盖问题。然后用几个定理及其证明说明了这种联系是存在的。基于这种联系,推断出求最小属性约简问题算法的近似度的上下界为ln(|U'|)-lnln(|U'|)+O(1)和(1-o(1))ln(|U'|)。最后,利用两个范例分别演示了如何具体地构造相关矩阵以及如何将解决集合覆盖问题的思想和方法应用到解决属性约简问题中来,由此推理如果将文献5中的解决集合覆盖问题的启发式方法应用到解决最小属性约简中,属性约简的复杂度为o(r2m3+m2),并且能以78%的“概率”得到最小属性约简。  相似文献   

5.
属性约简是粗糙集理论中的重要问题。许多学者针对邻域粗糙集提出多种属性约简方法,包括应用最为广泛的启发式算法。在多半径邻域粗糙集的基础上,针对当前启发式约简算法往往会包含一定冗余属性的缺陷,提出一种融合属性权重影响的改进约简运算方法,通过根据各属性权值大小设置阈值使得约简结果能够消除冗余属性。实验选取UCI的数据集与当前几种常用启发式约简算法进行比较分析。实验结果表明,所提出的属性约简方法能够得到更优的约简集合,同时更大程度地保留了决策表本身的知识信息,具有较高的分类能力。  相似文献   

6.
一种求解集合覆盖问题的启发式算法   总被引:3,自引:0,他引:3  
集合覆盖问题是运筹学研究中的一个基本的组合优化问题,它通常描述成如下的一个覆盖问题:从一个m行、n列的0-1矩阵(aij)m×n中选出若干列盖住所有的行,使得付出的代价最小.集合覆盖问题被广泛应用到航空人员行程安排、电路设计、运输的车辆路线安排等领域.对这一问题,国内外学者提出了诸如遗传算法、模拟退火算法、蚁群算法、人工神经网络算法等求解算法.本文以贪心算法为基础,利用人类的智慧和经验,提出了一种求解集合覆盖问题的启发式算法.算法的主要思想为:从某个解出发,随机移除一定比例的列,再用贪心策略加入若干列.用本文提出的算法,对Beasley提出的45个测试实例进行了实算测试,所得结果和最优解的平均相对差值为0.44%,并且得到了其中33个实例的最优解,实算结果表明,本文提出的算法对求解集合覆盖问题是行之有效的.  相似文献   

7.
基于改进遗传算法的粗糙集属性约简算法   总被引:1,自引:0,他引:1  
属性约简是粗糙集理论研究的主要内容之一,为了能够有效地获取决策表中属性最小约简,在分析属性约简的方法与遗传算法的基础上,将属性重要性度量作为启发式信息引入遗传算法,提出了一种启发式遗传算法.通过构造新的变异算子来引入启发式信息,体现了启发式信息的局部搜索技术,使得算法既保持整体优化特性,又具有较快的收敛速度.实验结果表明,该方法能快速有效地求出决策表的最小约简.  相似文献   

8.
针对数据集为模糊值时冗余信息难于消除的问题,提出了基于模糊相似关系的广义模糊粗糙集与QuickReduct算法相结合的方法。利用广义模糊粗糙集数据相似程度对属性值为实数值的数据集合进行约简,不需要预先对原始数据集合进行离散化,约简结果能更完整地反映原信息系统的分类能力。同时算法中利用了启发式信息,使模糊依赖性增加较快的属性作为最小约简。计算实例验证了该方法的有效性。  相似文献   

9.
针对航班正常性问题,在飞机排班问题基础上,引入正常性约束,建立面向正常性的飞机排班模型,提出一种两阶段启发式算法进行求解.构建符合正常性要求的候选航班链集合,将排班问题转化为候选链对航班计划的集合覆盖问题.通过0-1整数规划求解集合覆盖问题,得到满足正常性约束的最小飞机数量排班方案.松弛正常性约束减小飞机使用数量,满足飞机数量约束.通过迭代搜索寻求正常性与飞机数量平衡的最优排班方案.实验结果表明,该方法可以有效提升航班计划的正常性期望.  相似文献   

10.
属性约简是粗糙集(rough set,RS)理论进行规则提取中的重要步骤之一.决策表的最小属性约简是NP-hard问题.遗传算法(genetic algorithm,GA)是求解此类问题的有效方法之一,但在利用遗传算法求解属性约简过程中,需要计算各个个体的适应度,每计算一个个体的适应度,需要根据该个体代表的属性组,组织决策表,对组织后的决策表进行扫描,这样,算法就需要多次对决策表进行操作,影响到算法的执行效率.我们基于集合理论,提出了关系积概念,把决策表的属性约简过程转化为关系积的运算,利用关系积计算遗传算法各个体的适应度,不需要扫描决策表,避免了对决策表的操作,提高了遗传算法求解属性约简的效率,通过实例对这一算法进行了详细的描述.  相似文献   

11.
对于约简来说,其前提是保证知识库分类能力不变,由此引入弱约简的定义。利用区分矩阵能很容易计算出弱约简和遗传算法可以在全局寻优的优势,将染色体对区分函数的覆盖度作为适应度函数的参数,提出了一种基于遗传算法和区分矩阵的属性约简算法。算法中从粒计算的角度,重新度量粒度,对基于划分和覆盖的粗糙集决策表进行了研究。用k近邻算法通过准确率对弱约简效果进行评估。通过UCI数据集证明了该算法的有效性。该算法的时间复杂度是多项式的。  相似文献   

12.
在粗糙集理论的各种应用中,属性约简算法具有重要的意义,因而对属性约简算法的研究一直是粗糙集理论研究中的重点问题之一。在对属性约简算法充分研究的基础上提出一种基于最小覆盖集的粗糙集属性约简算法,即通过构造知识系统的一种改进的相关矩阵将属性约简简化为最小覆盖问题。将该算法与文献[7]中的算法进行实验比较并对结果进行分析,实验结果表明,当随着数据量增大时该算法具有更小的时间复杂度。  相似文献   

13.
本体映射是基于本体的语义查询与集成的基础.本体映射发现的任务是从源本体和目标本体的相似度中发现本体映射,它是本体映射的关键.将本体映射发现问题看成是集合覆盖问题,提出一种基于集合覆盖的本体映射发现方法SME(SCM-hased Mapping Extraction),该方法在训练阶段找到最大程度覆盖训练数据的属性集,在测试阶段利用这些属性集在测试数据上对应属性值的交操作来发现映射.实验证明该方法具有较好的综合性能.  相似文献   

14.
刘刚  黎放  狄鹏 《计算机科学》2013,40(Z6):54-57
测试优化选择是个集覆盖问题,而启发式算法是求解集覆盖问题的有效方法。文中将遗传算法、BP神经网络和模拟退火算法进行融合,提出了一种融合算法,该算法充分利用遗传算法全局搜索能力强、BP神经网络训练能力强和模拟退火算法搜索速度快的优点,既避免陷入局部最优的现象,又提高了搜索的效率和精度。该算法已应用于求解测试优化问题。实例证明,该算法能够快速有效地求得测试优化问题的最优解。  相似文献   

15.
Rough set theory has been extensively discussed in the domain of machine learning and data mining. Pawlak’s rough set theory offers a formal theoretical framework for attribute reduction and rule learning from nominal data. However, this model is not applicable to numerical data, which widely exist in real-world applications. In this work, we extend this framework to numerical feature spaces by replacing partition of universe with neighborhood covering and derive a neighborhood covering reduction based approach to extracting rules from numerical data. We first analyze the definition of covering reduction and point out its advantages and disadvantages. Then we introduce the definition of relative covering reduction and develop an algorithm to compute it. Given a feature space, we compute the neighborhood of each sample and form a neighborhood covering of the universe, and then employ the algorithm of relative covering reduction to the neighborhood covering, thus derive a minimal covering rule set. Some numerical experiments are presented to show the effectiveness of the proposed technique.  相似文献   

16.
为了解决单一神经网络模型很难满足股票预测建模要求的问题,提出一种基于遗传算法的粗糙集属性约简方法和神经网络相结合的预测模型。在该模型中,改进了自适应性遗传算法的交叉算子与变异算子。基于该遗传算法的粗糙集属性约简相比传统的粗糙集属性约简,其具有更强的求解最小属性约简的能力,解决了神经网络预测时训练速度慢、内存开销大等问题;在数据预处理过程中,引入聚类分析,有效解决了连续属性离散化的问题。实验结果证明,该预测模型具有较高的预测精度,在时间序列的股票预测中是相当有效的。  相似文献   

17.
In this paper, a new approach to fault diagnosis in electrical distribution network is proposed. The approach is based upon the parsimonious set covering theory and a genetic algorithm. First, based on the causality relationship among section fault, protective relay action and circuit breaker trip, the expected states of protective relays and circuit breakers are expressed in a strict mathematical manner. Secondly, the well developed parsimonious set covering theory is applied to the fault diagnosis problem. A 0–1 integer programming model is then proposed. Thirdly, a powerful genetic algorithm (GA) based method for the fault diagnosis problem is developed by using information on operations of protective relays and circuit breakers. The developed method can deal with any complicated faults, and simultaneously determine faulty sections and any hidden defects in the feeder protection systems. Test results for a sample electrical distribution network have shown that the developed mathematical model for the fault diagnosis problem is correct, and the adopted GA based method is efficient.  相似文献   

18.
We introduce a new continuous location-allocation problem where the facilities have both a fixed opening cost and a coverage distance limitation. The problem has wide applications especially in the spatial planning of water and/or energy access networks where the coverage distance might be associated with the physical loss constraints. We formulate a mixed integer quadratically constrained problem (MIQCP) under the Euclidean distance setting and present a three-stage heuristic algorithm for its solution: In the first stage, we solve a planar set covering problem (PSCP) under the distance limitation. In the second stage, we solve a discrete version of the proposed problem where the set of candidate locations for the facilities is formed by the union of the set of demand points and the set of locations in the PSCP solution. Finally, in the third stage, we apply a modified Weiszfeld’s algorithm with projections that we propose to incorporate the coverage distance component of our problem for fine-tuning the discrete space solutions in the continuous space. We perform numerical experiments on three example data sets from the literature to demonstrate the performance of the suggested heuristic method.  相似文献   

19.
协同过滤(CF)无法同时提供高精度和多样化的个性化推荐.基于此情况,文中提出基于覆盖约简的协同过滤方法(CRCF).结合覆盖粗糙集中的覆盖约简算法与CF中的用户约简,匹配覆盖中的冗余元素与邻近用户中的冗余用户,利用覆盖约简算法将冗余用户从目标用户的邻近用户中移除,保证CF中邻近用户的高效性.在公开数据集上的实验表明,在稀疏数据环境下,CRCF可以同时为目标用户提供高精度和多样化的个性化推荐.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号