首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 703 毫秒
1.
自动文本分类的效果在很大程度上依赖于属性特征的选择。针对传统基于频率阈值过滤的特征选择方法会导致有效信息丢失,影响分类精度的不足,提出了一种基于粗糙集的文本自动分类算法。该方法对加权后的特征属性进行离散化,建立一个决策表;根据基于依赖度的属性重要度对决策表中条件属性进行适当的筛选;采用基于条件信息熵的启发式算法实现文本属性特征的约简。实验结果表明,该方法能约简大量冗余的特征属性,在不降低分类精度的同时,提高文本分类的运行效率。  相似文献   

2.
将信息熵理论与直觉模糊粗糙集结合起来,提出一种基于互信息的直觉模糊粗糙集属性约简新算法.给出了在直觉模糊环境下,基于互信息的属性重要度和属性依赖度的度量准则.本文所提出的算法以属性重要度和依赖度为双重度量标准,采取可增可删的双向回归算法,在保持分类精度不变的情况下,最后得到决策表的最小属性约简.实例表明在多属性的决策表约简中,在本文提出的算法得到的属性约简的基础上而得到的决策规则是较简捷、较完备的.  相似文献   

3.
决策表属性约简是粗糙集理论中的重要问题,经典决策表属性约简方法从保持论域划分能力的角度出发,选择最优条件属性约简集.从决策属性与条件属性的相关性角度出发,将决策表属性约简思想与传统统计学中的对应分析方法相结合,提出了一种量化决策属性与条件属性之间依赖关系的度量,称为投影区分度,并基于此发展了一种决策表属性约简算法.最后用简单实例说明了该方法的正确性.  相似文献   

4.
基于依赖度之差的属性重要性评分   总被引:2,自引:0,他引:2  
目前粗糙集决策表中条件属性的重要性基本上是用条件属性的依赖度进行评判的.在决策表约简中,利用条件属性的依赖度进行评判可能会造成某些重要的条件属性的简单丢弃,影响了决策的准确性.因此提出并分析了基于依赖度之差的属性重要性的判断方法,该方法可以确保得到决策表的重要属性,得出了用依赖度之差判断属性重要性更加准确的结论,同时,给出了依赖度之差的求解步骤和算法,并通过实例验证了用依赖度之差判断属性重要性的有效性.  相似文献   

5.
为了求取决策表系统中属性的最小约简,本文提出了一种基于免疫算法的属性约简方法。该算法应用决策表的相对核来初始化种群,根据决策属性对条件属性的依赖度和抗体中条件属性的个数设计抗体的适应度函数,通过免疫记忆特性和抗体浓度的促进与抑制作用,保持了个体的多样性,提高了算法的全局搜索能力,避免陷入局部最优现象,从而求解出最小属性约简集合。实验结果表明,算法快速、有效,能得到较好的最小属性约简。  相似文献   

6.
基于粗糙集和信息增益的属性约简改进方法   总被引:2,自引:0,他引:2  
针对属性过多对于有效的数据挖掘很不利以及约简中差别矩阵的产生会占用较大存储空间的问题,提出了一种基于粗糙集和信息增益的属性约简改进算法.该算法首先采用信息增益技术对决策表属性进行相关分析,删除部分冗余属性,减小属性约简的复杂度,然后直接从决策表中提取出分明函数,求出属性约简.由于避免了分明矩阵的生成,因此该算法不仅节约了时间和空间,而且提高了效率.  相似文献   

7.
提出一种信息观下的差别矩阵,并基于该矩阵设计了一种信息观下决策表的属性约简算法,该算法以信息观下属性核为起点,通过计算信息观下差别矩阵中各属性出现的频率确定属性的重要度,进而根据各个属性的重要度来计算属性约简。实验结果表明,该算法可以求出更有效的信息观下属性约简,且计算约简耗时更少。  相似文献   

8.
目前已有蚁群算法优化的特征选择方法,大多采用的是以属性依赖度和信息熵属性重要度作为路径上启发搜索因子,但这类搜索方法在某些决策表中存在算法早熟或搜索到的特征子集包含了冗余特征,从而导致选择精度显著下降。针对此类问题,根据条件属性在分辨矩阵中的占比提出了一种属性重要度的度量方法,以分辨矩阵重要度作为路径上启发因子,设计了一种基于分辨矩阵与蚁群算法优化的特征子集搜索方法。该算法从特征核出发,蚁群依次选择概率大的特征加入特征核集,直至找到最小特征子集算法终止。通过实例验证和UCI数据集实验结果表明,与基于属性依赖度和信息熵属性重要度的特征选择方法相比,在通常情况下,该算法能较小代价找到最小特征子集,并且可以有效减少计算工作量。  相似文献   

9.
给出了基于正区域的决策表知识约简的定义和算法,针对此算法的不足,提出了算法改进以完成包含大量条件属性的约简。通过其在电器销售系统中的应用,去除冗余或不相关的条件属性,大大减少了要处理的数据量,简化了决策信息系统。  相似文献   

10.
在决策表中,为了评价某条件属性的重要性,不但要考虑这个属性(单一属性)相对于决策属性的重要性,还要考虑该条件属性与其他条件属性构成的属性集的重要性。在属性集依赖度比单一属性依赖度更加可信的事实基础上,提出了一个基于分辨矩阵的属性集依赖度计算方法。该方法能够较快地获得分辨矩阵,并直接求出属性集的依赖度,从而大大降低了算法的时间复杂度。实例验证了该方法具有较好的有效性和较低的时间复杂度。  相似文献   

11.
欧彬利  钟夏汝  代建华  杨田 《计算机应用》2020,40(12):3465-3470
精准且快速地识别异常用户行为是入侵检测系统(IDS)的重要任务。针对入侵检测数据维度高、样本量大的问题,提出了基于变精度覆盖粗糙集的相关族属性约简方法,并将其运用至入侵检测数据中。首先,基于覆盖决策表生成条件属性的变精度相关族;然后,在所有条件属性变精度相关族的基础上利用启发式算法求得决策表的属性约简;最后,在上述的基础上结合分类器对入侵检测数据进行检测。实验结果表明,所提方法具有计算属性约简时间短的优点,在大样本数据集上,基于模糊粗糙集依赖度的属性约简算法NFRS运行所需时长为该算法的96倍。在入侵检测数据集NSL-KDD上,该方法可快速识别关键属性,剔除无效信息,其整体准确率可达到90.53%,且对Normal的识别准确率可达到97%。  相似文献   

12.
欧彬利  钟夏汝  代建华  杨田 《计算机应用》2005,40(12):3465-3470
精准且快速地识别异常用户行为是入侵检测系统(IDS)的重要任务。针对入侵检测数据维度高、样本量大的问题,提出了基于变精度覆盖粗糙集的相关族属性约简方法,并将其运用至入侵检测数据中。首先,基于覆盖决策表生成条件属性的变精度相关族;然后,在所有条件属性变精度相关族的基础上利用启发式算法求得决策表的属性约简;最后,在上述的基础上结合分类器对入侵检测数据进行检测。实验结果表明,所提方法具有计算属性约简时间短的优点,在大样本数据集上,基于模糊粗糙集依赖度的属性约简算法NFRS运行所需时长为该算法的96倍。在入侵检测数据集NSL-KDD上,该方法可快速识别关键属性,剔除无效信息,其整体准确率可达到90.53%,且对Normal的识别准确率可达到97%。  相似文献   

13.
粗糙集理论是一种有效的信息处理工具,属性约简是粗糙集理论研究的一个核心内容。为了能够较为有效地获得不相容决策表较优的属性约简,在对文献[7]中属性约简算法分析的基础上,根据不相容决策表约简不改变决策表正域的原则,仅考虑相对差异比较表中与正域相关的实例对,同时结合属性重要性作为特征选取的启发式信息,提出了一种改进的启发式属性约简算法。该算法在不增加算法时间复杂度的前提下能够处理不相容决策表。最后,通过实例完整演示了该方法,表明该算法是有效的。  相似文献   

14.
粗糙集理论是一种有效的信息处理工具,属性约简是粗糙集理论研究的一个核心内容.为了能够较为有效地获得不相容决策表较优的属性约简,在对文献[7]中属性约简算法分析的基础上,根据不相容决策表约简不改变决策表正域的原则,仅考虑相对差异比较表中与正域相关的实例对,同时结合属性重要性作为特征选取的启发式信息,提出了一种改进的启发式属性约简算法.该算法在不增加算法时间复杂度的前提下能够处理不相容决策表.最后,通过实例完整演示了该方法,表明该算法是有效的.  相似文献   

15.
针对启发式约简算法难以获得最小约简的问题,研究属性之间的排斥与吸引等关联特性,给出属性重要度计算指数。在此基础上,结合属性频率方法,提出基于属性关联的启发式约简算法。该算法以最小约简为目标,采取兼顾单个属性的辨识能力以及属性之间关联的约简策略。实验结果表明,该算法比属性频率方法以及一些同类算法具有更少的属性启发次数,计算结果大部分为最小约简。  相似文献   

16.
Attribute reduction based on rough set theory has attracted much attention recently. In real‐life applications, many decision tables may vary dynamically with time, e.g., the variation of attributes, objects, and attribute values. The reduction of decision tables may change on the alteration of attribute values. The paper focuses on dynamic maintenance of attribute reduction when varying data values of multiple objects. Incremental mechanisms for knowledge granularity are proposed first, which aims to update attribute reduction effectively. Then, a group incremental reduction algorithm with varying data values is developed. When attribute values of multiple objects have been replaced by new ones in decision table, the proposed incremental algorithm can find the new reduct in a much shorter time. The time complexity analysis and experiments on different data sets from UCI have validated that the proposed incremental algorithms are efficient and effective to update the reduction with the variation of attribute values.  相似文献   

17.
分析了传统属性频率函数作为属性重要度的不足,重新定义了属性重要度,提出了一种基于差别矩阵属性重要度的属性约简完备算法,即CRABSA(Complete Reduction Algorithm Based on the Significance of Attribute)。该算法采用迭代思想,在每次迭代过程中根据属性重要度SGF(a)选择必要的条件属性加入约简R中。由SGF(a)的定义可知,算法能确保在大多数情况下能得到决策表的最小约简。分析了算法在最坏情况下的时间复杂度,给出了该算法相对Pawlak约简的完备性的证明。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号