首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 69 毫秒
1.
在基于邻域粗糙集的属性约简算法中,正域计算是保证其有效性的重要依据,也是影响其时间开销的最主要部分。为了减少算法时间开销,通过对现有算法FHARA的正域计算进行改进,采取保留策略,利用矩阵保留度量计算值的平方,将原本◢n◣维上的计算改进为1维上的计算,从而缩减了每次度量计算的时间,并在此基础上提出了基于矩阵保留策略的邻域粗糙集属性约简算法,最后通过多个UCI数据集验证了该算法。与现有算法相比较,实验结果表明,对大部分数据集而言,该算法能有效且更快速地得到数据集的属性约简。  相似文献   

2.
3.
基于邻域粗糙集的符号与数值属性快速约简算法   总被引:6,自引:0,他引:6  
粗糙集理论被广泛应用于属性约简,算法复杂性是制约约简应用于大样本知识发现的主要问题,尤其是邻域模型下的约简问题.本文分析邻域粗糙集模型的数学性质,利用正域与属性集的单调关系,构造基于属性依赖度和前向搜索策略的快速算法.该算法降低样本比较次数,提高计算效率.实验分析表明该算法的有效性.  相似文献   

4.
邻域粗糙集可以直接处理数值型数据, F- 粗糙集是第一个动态粗糙集模型. 针对动态变化的数值型数据, 结合邻域粗糙集和F- 粗糙集的优势, 提出了F- 邻域粗糙集和F- 邻域并行约简. 首先, 定义了F- 邻域粗糙集上下近似、边界区域; 其次, 在F- 邻域粗糙集中提出了F- 属性依赖度和属性重要度矩阵; 根据F- 属性依赖度和属性重要度矩阵分别提出了属性约简算法, 证明了两种约简方法的约简结果等价; 最后, 比对实验在UCI数据集、真实数据集和MATLAB生成数据集上完成, 实验结果显示, 与相关算法比较, F- 邻域粗糙集可以获得更好的分类准确率. 为粗糙集在大数据方面的应用增加了一种新方法.  相似文献   

5.
作为Pawlak粗糙集的扩展,邻域粗糙集能有效地处理数值型的数据。但是,因为沿用了Pawlak粗糙集在构造上下近似集时的包含关系,邻域粗糙集对噪声数据的容错性很差。针对这个问题,本文通过引入贝叶斯最小风险决策规则,提出了一种基于容错改进的邻域粗糙集属性算法。通过和现有的算法进行比较,实验结果表明,在数据预处理阶段用该算法能得到更好的属性约简。  相似文献   

6.
属性约简是粗糙集理论研究的核心问题之一,而且现已证明寻找一个决策表的最小约简是NP-hard问题.针对变精度粗糙集理论的属性约简问题,从相对可辨识矩阵,属性的重要度作为启发式的信息,给出变精度粗糙集的属性约简算法的改进,在一定程度上简化了属性约简的计算,提高了属性约简的效率.最后通过实例证明了改进的算法给出信息系统的属性约简结果的正确性.  相似文献   

7.
基于遗传算法的粗糙集属性约简算法   总被引:1,自引:0,他引:1  
为了研究粗糙集理论中属性约简问题,给出了一种属性相对重要度定义,证明了其合理性,并将它应用到基于遗传算法的约简算法中,提出一种启发式遗传算法.算法采用修正策略保证群体进化收敛于最小约简,同时引入属性相对重要度作为启发信息,加快算法的收敛速度.对算法进行的时间复杂度和完备性分析以及数值实验表明,基于遗传算法的粗糙集属性约简算法具有完备、快速收敛等特点.  相似文献   

8.
基于粗糙集的快速属性约简算法研究   总被引:1,自引:0,他引:1       下载免费PDF全文
通过分析现有相容决策表属性约简算法,找出了计算低效性的根源。新的约简算法从论域的角度出发,采用层次结构,用属性边界域作为度量属性重要性启发函数。该算法使得论域不断缩小的同时,又能选出反映决策表系统特征的重要属性。理论分析和实验表明,该算法保证在分类精度不变的前提下,获得最优或次优的约简属性集。  相似文献   

9.
在分析邻域粗糙集模型弊端的基础上,提出了非对称变邻域粗糙集模型,并以全局属性重要度为启发条件,构造了基于非对称变邻域粗糙集模型的属性约简的启发式算法.利用6个UCI标准数据集与现有算法进行了比较分析,结果表明,该模型不仅可以选择较少的属性个数,而且还能保持较高的分类能力.  相似文献   

10.
属性约简是机器学习等领域中常用的数据预处理方法。在基于粗糙集理论的属性约简算法中,大多是根据单一的方法来度量属性重要度。为了从多角度对属性达到更为优越的评估效果,首先在已有的模糊邻域粗糙集模型中定义属性依赖度度量,然后根据粒计算理论中知识粒度的概念,在模糊邻域粗糙集模型下提出了模糊邻域粒度度量。由于属性依赖度和知识粒度代表了不同视角的属性评估方法,因此将这两种方法结合起来用于信息系统的属性重要度评估,最后给出一种启发式属性约简算法。实验结果表明,所提出的算法具有较好的属性约简性能。  相似文献   

11.
属性约简是粗糙集理论中的重要问题。许多学者针对邻域粗糙集提出多种属性约简方法,包括应用最为广泛的启发式算法。在多半径邻域粗糙集的基础上,针对当前启发式约简算法往往会包含一定冗余属性的缺陷,提出一种融合属性权重影响的改进约简运算方法,通过根据各属性权值大小设置阈值使得约简结果能够消除冗余属性。实验选取UCI的数据集与当前几种常用启发式约简算法进行比较分析。实验结果表明,所提出的属性约简方法能够得到更优的约简集合,同时更大程度地保留了决策表本身的知识信息,具有较高的分类能力。  相似文献   

12.
基于粗糙集的属性约简方法研究综述*   总被引:1,自引:0,他引:1  
针对经典粗糙集理论的属性约简,从三个方面对属性约简方法进行综述。最后对属性约简中存在的问题进行了分析,并提出了进一步研究的方向。  相似文献   

13.
对基于邻域粗糙集的属性约简算法而言,正域计算是保证其有效性的重要依据,也是影响其时间开销的最主要部分。正域计算的速度主要由样本间度量计算的次数决定。在确保正确性的条件下,样本间度量计算的次数越少,则正域计算越快。在现有的正域计算中,通常存在着大量同类别样本间的度量计算。针对这个现象,首先证明在邻域粗糙集的正域计算中,同类别样本间的度量计算对正域计算是无贡献的,然后据此提出了基于样本类别的正域计算。和现有的正域计算相比,实验结果表明,该正域计算有效且更快速。而且,该正域计算更适用于样本类别数较少的数据集。  相似文献   

14.
针对基于正域的属性约简算法在约简过程中存在重复计算属性相对重要度从而导致算法效率低的问题,从属性度量和搜索策略的角度提出基于知识粗糙熵的快速属性约简算法。首先,在决策信息系统中通过引入知识距离提出知识粗糙熵以度量知识的粗糙程度;其次,利用知识粗糙熵作为属性显著度的评价标准来评估单个属性的重要程度;最后,利用属性重要度对所有条件属性进行排序,且通过属性依赖度删除冗余属性,从而实现快速约简。在六个公开数据集上将所提算法与其他三种算法在运行效率和分类精度上进行对比实验。结果表明,该算法的运行效率比其他三种算法分别提高了83.24%、28.77%和59.92%;在三种分类器中,分类精度分别平均提高了0.83%、0.63%和1.37%。因此,所提算法在保证分类性能的同时,能以更快的速度获得约简。  相似文献   

15.
目前的决策粗糙集研究主要集中在完备离散型信息系统,很少有对不完备连续型数据进行研究,考虑这一问题,提出一种不完备邻域决策粗糙集模型。首先在不完备连续型数据中引入了不完备邻域关系,然后利用该二元关系对传统的决策粗糙集进行重构,一种称之为不完备邻域决策粗糙集的模型被提出,同时基于决策代价原则,进一步地提出了最小化决策代价的属性约简算法。最后通过实验表明了所提出的算法具有更高的属性约简性能。  相似文献   

16.
传统粗糙集分类方法过于严格,对噪音过分敏感。针对带不确定因子决策系统,提出一种基于属性依赖度的约简算法,使含不确定信息及数据噪音的系统中的属性得以简化,找到一种具有广泛表达能力的数据隐含格式,删去冗余的规则,并保持系统的原有用途和性能。通过一个例子实现了该算法。  相似文献   

17.
属性约简是粗糙集合研究的重要内容之一。为了能够有效地获取决策表中属性最小相对约简,提出了一种基于GA-PSO的属性约简算法。该算法以条件属性对决策属性的支持度为基础,求解核属性,把所有的条件属性(除去核属性)加入粒子群算法的初始种群中,并用遗传算法对不满足适应度条件的粒子进行交叉变异操作。实验结果表明,该算法在加强局部搜索能力的同时保持了该算法全局寻优的特性,能够快速有效地获得最小相对属性集。  相似文献   

18.
属性约简的效率是粗糙集等软计算理论的核心问题之一。为了提高约简效率,在分析不可分辨关系和基数排序特点的基础上,提出了一种时间复杂度为O(|C||U|)的求核算法。然后,运用改进的属性重要度作为启发信息,得到一种快速的属性约简算法,时间复杂度为O(|C|2|U|)。最后,通过UCI机器学习库中的一些数据集对算法进行测试,证明了算法对大型的数据集进行属性约简的高效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号