共查询到20条相似文献,搜索用时 82 毫秒
1.
多粒度邻域粗糙集是邻域粗糙集理论的一种新型数据处理模式,其目标概念分别由乐观和悲观的上、下近似边界描述。但当前的多粒度邻域粗糙集既缺乏利用已有的信息粒近似描述目标概念的方法,又无法处理目标概念为模糊的情形。而张清华教授提出的粗糙集近似理论提供了一种利用已有信息粒近似描述知识的方法,为构建多粒度邻域粗糙模糊集的近似精确集提供了新思路。文中首先针对模糊目标概念,将粗糙集近似理论应用到邻域粗糙集领域,提出了代价敏感的邻域粗糙模糊集的近似表示模型;然后进一步从多粒度视角,构建出一种代价敏感的邻域粗糙模糊集的多粒度近似表示模型,并分析了其相关性质;最后,通过实验仿真,验证了当多粒度代价敏感近似及其上、下近似方法分别去近似刻画模糊目标概念时,多粒度代价敏感近似方法产生的误分类代价最小。 相似文献
2.
随着信息大爆炸时代的到来,数据集的巨大化和数据集结构的复杂化已经成为近似计算中不能忽视的问题,而动态计算是解决这些问题的一种行之有效的途径。对现有的应用于经典多粒度粗糙集动态近似集更新方法进行了改进,提出了应用于变精度多粒度粗糙集(VPMGRS)的向量矩阵近似集计算与更新方法。首先,提出了一种基于向量矩阵的VPMGRS近似集静态计算算法;其次,重新考虑了VPMGRS近似集更新时的搜索区域,并根据VPMGRS的性质缩小了该区域,有效地提升了近似集更新算法的时间效率;再次,根据新的搜索区域,在VPMGRS近似集静态计算算法的基础上提出了一种新的VPMGRS近似集更新的向量矩阵算法;最后,通过实验验证了所提算法的有效性。 相似文献
3.
《计算机科学与探索》2018,(5):839-850
决策粗糙集和多粒度粗糙集是两种重要的数据处理机制。在对多重代价决策粗糙集模型和多粒度粗糙集模型的研究基础上,通过综合考虑多重代价矩阵和多粒度思想,将权重均值代价策略引入决策粗糙集模型中,提出了一种基于权重多重代价的多粒度决策粗糙集模型。在不完备信息系统中,分析了悲观代价决策粗糙集、乐观代价决策粗糙集和权重多重代价多粒度决策粗糙集模型,并给出了以上各种模型的决策代价总代价计算公式。以权重多重代价悲观多粒度决策粗糙集模型为例,讨论了该模型下随着粒度的变化其正域的变化情况,并给出了一种基于代价最小化的粒度约简方法。该模型更好地结合了决策粗糙集模型和多粒度粗糙集模型,可从多角度分析解决决策粗糙集模型中的相关问题。 相似文献
4.
针对决策粗糙集属性约简在引入代价后分类精度不高的问题,对其中代价敏感与分类精度的平衡进行了研究。将分类总代价和近似分类质量作为属性约简过程中的约束条件,结合模拟退火方法,提出了一个基于代价敏感和近似分类质量的决策粗糙集属性约简(ARACOQ)算法。利用UCI数据集对算法进行了模拟实验,实验结果验证了ARACOQ算法的有效性,该算法能够在可承受代价范围内找到一个分类精度最高的属性约简集。 相似文献
5.
为了在多粒度粗糙集模型中对目标概念达到更好的近似逼近效果,首先将直觉模糊粗糙集与多粒度粗糙集结合,提出直觉模糊多粒度粗糙集模型。由于该模型的目标近似存在过于宽松的缺陷,因此通过引入参数的方式对所提模型进行改进,提出一种可变直觉模糊多粒度粗糙集模型,并证明了该模型的有效性,同时基于该模型提出了相应的近似分布约简算法。在仿真实验结果中,所提出的下近似分布约简结果比已提出的模糊多粒度决策理论粗糙集约简和多粒度双量化决策理论粗糙集多了2~4个属性,所提出的上近似分布约简算法比这些算法少了1~5个属性,同时约简结果的近似精度拥有了更为合理且优越的表现。因此,理论和实验结果均验证了所提的可变直觉模糊多粒度粗糙集模型在近似逼近和数据降维方面均具有更高的优越性。 相似文献
6.
将决策粗糙集与代价敏感学习相结合,提出了一种基于决策粗糙集的代价敏感分类方法。依据决策粗糙集理论和属性约简方法,对待预测样本分别计算最优测试属性集,使得样本在最优测试属性集上计算的分类结果具有最小误分类代价和测试代价,依此给出样本的最小总代价分类结果。针对全局最优测试属性集求解过程中计算复杂度高的问题,提出了局部最优测试属性集的启发式搜索算法。该算法以单个属性对降低总分类代价的贡献率为启发函数,搜索各样本的局部最优测试属性集,并输出在局部最优测试属性集上样本的代价敏感分类结果。在UCI数据上的实验分析显示,所提算法有效地降低了分类结果的总代价和测试属性个数,使得样本分类结果同时具有较小的误分类代价和较小的测试代价。 相似文献
7.
粗糙集近似与信息粒度 总被引:1,自引:0,他引:1
用粗糙集近似描述了三类常见信息系统(即Pawlak信息系统、不完备信息系统、不完备模糊信息系统)中对象的基本信息粒度.通过信息系统中对象属性值关于对象属性近似空问的上近似可以得到与对象具有相同或相似信息的对象集,即利用对象属性值关于对象属性近似空间的上近似将对象属性值信息变换成为对象的基本信息粒度. .所得结论对信息系统中基本信息粒度的物理意义有了比较清楚和更加合理的解释. 相似文献
8.
9.
针对不完备信息系统变化时缺失值获取具体属性值的特性,为解决多粒度粗糙集中更新近似集时间效率低的问题,提出了一种基于容差关系的近似集动态更新算法。首先,讨论了基于容差关系的近似集变化的性质,并根据相关性质得出乐观、悲观多粒度粗糙集的近似集的变化趋势;然后,针对更新容差类效率低的问题,提出了动态更新容差类的定理;最后,在此基础上,设计出基于容差关系的近似集动态更新算法。采用UCI数据库中4个数据集进行仿真实验,当数据集变大时,所提更新算法的计算时间远小于静态更新算法的计算时间,即所提动态更新算法的时间效率高于静态算法,验证了所提算法的正确性和高效性。 相似文献
10.
动态粒度下的粗糙集近似 总被引:6,自引:0,他引:6
粒度计算是粗糙集理论研究的一种强有力的工具。本文讨论了粒度意义下的粗糙集近似,并定义了动态粒度下的正向近似。另外,本文还从粒度的角度讨论了聚类结果和先验知识的协调度问题,并提出了一种基于动态粒度下的正向近似的聚类算法。这些结果将有助于粒度计算和粗糙集理论的研究。 相似文献
11.
王天擎 《计算机工程与设计》2008,29(24)
蚁群算法中的信息素更新对整个算法的性能起到决定性的作用.在时蚁群算法进行系统仿真实验过程中,发现存在多种不确定因素影响信息素的更新.粗糙集是一种处理不确定和模糊知识的工具,本文利用粗糙集对试验结果进行了分析,给出了不确定因素之间的关系,并根据分析结果对信息素更新策略作了相应的改进,提高了算法的性能. 相似文献
12.
为了克服现有作积形式不确定性度量方法的缺陷, 基于边界域提出一种用改进粗糙度和知识粒度求和形式的粗糙不确定性度量公式. 与现有方法相比, 它同时考虑了由边界域和知识粗糙性产生的不确定性, 从理论上证明了集成后的不确定性度量值确实比单个影响因素产生的不确定性度量值大, 是一种更加合理的不确定性度量方法. 将该方法推广到基于严凸函数知识粒度情形, 得到一类度量粗糙集不确定性度量方法, 并研究了随划分变细时, 粗糙 度、改进粗糙度与所提出方法之间的关系. 最后设计了一组算例对它们进行比较, 比较结果表明, 所提出的方法对划分变细更加敏感.
相似文献13.
为了提升风险决策环境下协同训练的效果, 提出了一种基于粗糙子空间的协同决策算法。首先利用粗糙集属性约简的概念, 将部分标记数据属性空间分解为两差异性较大的粗糙子空间; 在各子空间上训练分类器, 并依据各分类器决策风险代价及隶属度将无标记数据划分为可信、噪声和待定样本。综合两分类器的分类结果, 标注少量可信无标记样本后重复协同训练。从理论上分析了算法性能提升的区间界, 并在UCI数据集上进行实验, 验证了模型的有效性及效率。 相似文献
14.
当计算划分层迭代数目较大,或是循环体单次迭代工作量较大,但可用的并行线程数目较小时,传统的基于循环分块的流水粒度优化方法无法进行处理。为此,提出一种基于循环分块减小流水粒度的方法,并根据流水并行循环的代价模型实现最优流水粒度的求解,设计实现了一个流水计算粒度的优化算法。对有限差分松弛法(FDR)的波前循环和时域有限差分法(FDTD)中典型循环的测试表明,与传统的流水粒度选择方法相比,所提算法能够得到更优的循环分块大小。 相似文献
15.
一种基于粗集理论的属性约简改进算法 总被引:11,自引:0,他引:11
利用粗集理论中属性的依赖度和重要度性质,提出一种对数据属性进行约简的改进算法,对该算法进行分析,并运用一个简单的例子对该算法的有效性进行验证。 相似文献
16.
《Pattern recognition letters》2007,28(4):459-471
We propose a new feature selection strategy based on rough sets and particle swarm optimization (PSO). Rough sets have been used as a feature selection method with much success, but current hill-climbing rough set approaches to feature selection are inadequate at finding optimal reductions as no perfect heuristic can guarantee optimality. On the other hand, complete searches are not feasible for even medium-sized datasets. So, stochastic approaches provide a promising feature selection mechanism. Like Genetic Algorithms, PSO is a new evolutionary computation technique, in which each potential solution is seen as a particle with a certain velocity flying through the problem space. The Particle Swarms find optimal regions of the complex search space through the interaction of individuals in the population. PSO is attractive for feature selection in that particle swarms will discover best feature combinations as they fly within the subset space. Compared with GAs, PSO does not need complex operators such as crossover and mutation, it requires only primitive and simple mathematical operators, and is computationally inexpensive in terms of both memory and runtime. Experimentation is carried out, using UCI data, which compares the proposed algorithm with a GA-based approach and other deterministic rough set reduction algorithms. The results show that PSO is efficient for rough set-based feature selection. 相似文献
17.
一种带松弛因子的统计粗糙集挖掘算法 总被引:1,自引:0,他引:1
针对实际应用领域数据挖掘的数据特征提出了基于底层数据信息归纳的带松弛因子的统计粗糙集数据挖掘算法DMSRIIR。该算法引进了保持原始底层数据信息的机制以及求近似约简的松弛因子,可以有效地避免生成规则的偶然性以及解决部分分类的问题。DMSRIIR还提供了应用粗糙集于实际数据挖掘的系统方法。实验表明了算法的可行性与有效性。 相似文献
18.
Solving the feature selection problem is considered an important issue when addressing data from real applications that contain a large number of features. However, not all of these features are important; therefore, the redundant features must be removed because they affect the accuracy of the data representation and introduce time complexity into the analysis of these data. For these reasons, the feature selection problem is considered an NP-complete nonlinearly constrained optimization problem. The rough set (RS) and neighborhood rough set (NRS) are the most powerful methods used to solve the feature selection problem; however, both approaches suffer from high time complexity. To avoid these limitations, we combined the RS and NRS with a new metaheuristic algorithm called the runner-root algorithm (RRA). The spirit of the RRA originated from real-life plants called running plants, which have roots and runners that spread the plants in search of minerals and water resources through their root and runner development. To validate the proposed algorithm, several UCI Machine Learning Repository datasets are used to compute the performance of our algorithm employing two effective classifiers, the random forest and the K-nearest neighbor, in addition to some other measures for the performance evaluation. The experimental results illustrate that the proposed algorithm is superior to the state-of-the-art metaheuristic algorithms in terms of the performance measures. Additionally, the NRS increases the performance of the proposed method more than the RS as an objective function. 相似文献
19.
阐述了粗糙集理论、遗传约简算法和粒子群约简算法。属性约简是知识发现的关键问题之一。传统的属性约简算法都是串行搜索的,算法效率低且收敛速度慢。将计算智能和粗糙集相结合,提出了一种基于遗传粒子群和粗糙集的最小属性约简算法。该算法利用属性依赖度计算属性核,并在种群初始化时引入属性核作为限制条件,动态调整适应度函数,以达到求得最小属性约简的目的。实验表明,对于数据量大、属性维度高的属性约简问题,该算法具有高效的处理能力。 相似文献
20.
将三枝决策粗糙集模型用于手写体汉字识别,建立三枝决策粗糙集模型,其区域分类以正、负和边界为基础,更好地体现手写体汉字识别分类近似性。定义了脱机手写体汉字识别决策信息系统特征属性约简相对粒度熵和属性重要度,将手写体汉字识别从属性重要度的角度出发,设计一种基于粒与粒之间逻辑运算的自下而上的粒度网结构,使手写体汉字识别属性集的适用粒度逐渐变大,可以获取更多的有效信息。仿真实验表明,该方法是可行有效的。 相似文献