首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 281 毫秒
1.
基于决策树的就业数据挖掘   总被引:12,自引:0,他引:12  
针对学生就业问题,给出了就业数据挖掘模型.决策树方法是数据挖掘中非常有效的分类方法,根据就业数据特点,采用了C4.5决策树算法.C4.5算法是决策树核心算法ID3的改进算法,它构造简单,速度较快,容易实现.模型对就业数据预处理,选取决策属性,实现挖掘算法并抽取规则知识,由规则知识指出哪些决策属性决定了就业单位的类别,挖掘结果表明,该算法能够正确将就业数据分类,并得到若干有价值的结论,供决策分析。  相似文献   

2.
粗糙集与决策树结合诊断故障的数据挖掘方法   总被引:5,自引:1,他引:5  
根据数据挖掘技术用于故障诊断的基本思想,利用粗糙集进行数据归纳,过滤大量故障数据中的冗余属性,得到精简故障数据集。而后,用决策树分类方法处理精简数据集,产生分类所需的规则以进行分类,并结合实例说明了该方法的工作步骤。由实例可知该方法用于故障诊断的可行性,最后指出实际应用过程中的一些技术难题。  相似文献   

3.
目的采用粗糙集中的属性依赖度分析方法对胶合板缺陷检测数据进行分析,获得各属性对决策的不同作用,并得出各属性间的依赖关系.方法采用粗糙集属性依赖度分析方法对实验数据进行有效分析,挖掘出对决策分析影响大的属性,去掉对决策分析影响小的冗余属性,构造数据挖掘模型.结果从胶合板缺陷检测数据中挖掘出各属性对决策分析的影响程度以及各有关属性间依赖关系的知识,在胶合板缺陷检测数据集的17个属性中,得到了3个重要属性,5个对决策影响较小的属性.结论基于粗糙集属性依赖度的数据挖掘方法提高获取规则的快速性,降低计算的复杂度,增强规则的可解释性,取得良好的研究结果.  相似文献   

4.
一种基于谓词逻辑的分类规则约简方法   总被引:1,自引:0,他引:1  
利用各种分类规则挖掘方法,提取出的分类规则集中,存在许多的冗余规则,从而降低了分类效率。采用谓词公式描述分类规则,给出了一种分类规则集约简方法。该方法利用谓词公式中的逻辑推理,对分类规则集进行约简,消除了冗余规则。采用恒星光谱数据,实验验证该方法在保证分类规则集的分类能力不变的前提下,有效地提高了分类的效率。  相似文献   

5.
商业智能研究中的商业数据挖掘,是从数据库中抽取对商业零售企业进销存具有潜在应用价值的隐含信息.给出了基于粗糙集理论的商业数据挖掘完整过程,结合商场客户价值分析的实例,使用粗糙集数据挖掘系统(RSDMS)进行数据预处理,消去冗余属性,抽取决策规则.  相似文献   

6.
在粗糙集和证据理论相结合的数据挖掘技术中,常用的方法是以证据理论为主,而将粗糙集作为获取证据权重的辅助手段.这种结合方法既不能有效发挥证据理论的数值计算作用,也不能很好利用粗糙集理论的分类功能.因此,文章提出一种新的粗糙集和证据理论相结合的数据挖掘技术.首先通过粗集理论对决策表进行约简,消除系统冗余,得到决策规则.其次对经过约简所得到的决策表进行数值处理,降低预测代价,并构建证据焦元空间.最后将证据焦元空间用合成规则进行融合.计算结果表明,文中所提出的粗糙集与证据理论相结合的数据挖掘方法,不但细化了决策规则,而且给出了决策系统规则的定量描述,有效地补充和扩展了证据理论的应用范围.  相似文献   

7.
目的将数据挖掘技术应用在胶合板缺陷检测数据中,提取出有效的、正确的规则信息.方法通过分析比较粗糙集软计算方法和决策树方法的特点,利用两种方法具有的优势互补性,将其进行有机集合,构造数据挖掘模型.结果从胶合板缺陷检测数据中挖掘出对用户有价值的决策规则,并将其用“IF—THEN”语句表达出来.以便指导以后的决策过程.结论基于粗糙集和决策树结合的数据挖掘方法提高了获取规则的快速性,降低了计算的复杂度,增强规则的可解释性,取得了良好的研究结果.  相似文献   

8.
通过分析分类规则与训练集之间的映射关系,采用集合的相关运算寻找特征规则及相应特征集.从而消除分类规则集中存在的冗余,并在此基础上提出了基于集合运算的分类规则处理算法(PASO)。最后,以恒星光谱数据为背帚,实验验证了该方法的正确性和可行性。  相似文献   

9.
灾害天气关联模式挖掘技术研究   总被引:2,自引:0,他引:2  
提出了一种对海量气象数据进行数据挖掘及提取灾害性天气间有效的关联模式的方法,对气象中蕴含的各种灾害性天气进行分类和有效数据处理,并使用Apriori算法进行关联规则挖掘,获得了有意义的灾害性气候的关联模式,可以指导灾害性天气的预报和支持决策.  相似文献   

10.
一个基于粗糙集和决策树的最简分类规则集生成算法   总被引:5,自引:0,他引:5  
利用粗糙集理论中属性核与不可分辨关系给出了属性约简和数据过滤算法,去除信息系统中与决策无关的冗余信号,在简化的信息系统基础上用传统算法构造决策树,总利用由粗糙度理论推出的极小、极大化学习方法对决策树规则进行极小、极大化处理,最后给出了一个最简分类规则集生成算法。  相似文献   

11.
粗糙集数据分析系统的程序实现   总被引:3,自引:0,他引:3  
粗糙集理论是一种新的处理不精确、不完全与不相容知识的数学工具。首先简述基于粗糙集方法的数据分析系统的基本构成,分析了粗糙集中连续属性离散化的方法,实现了连续属性数据进行数据离散化。围绕不可区分关系和相对正区域两个核心概念,通过知识之间的依赖程度,提出了粗糙集数据分析的算法,通过比较属性约简的数目,选择最少属性数量的约简结果。得到了求取相对核、上(下)近似集、等价关系、相对重要度、属性相对约简、范畴相对约简、最小决策规则等的各种算法的程序实现。给出了利用MATLAB实现该系统约简化、核及最小决策规则的程序。最后给出实际工程系统的程序运行结果,对滚动轴承故障诊断的仿真实例表明,该方法简化了诊断规则,得到较高的故障诊断正确率。对推动粗糙集理论在具体实践中应用具有实际意义。  相似文献   

12.
提出了一种基于rough set和neural network的数据挖掘新方法。首先利用粗集理论对原始数据进行一致性属性约简,然后使用神经网络对数据进行学习,并同时完成属性的不一致约简,最后再由粗集对神经网络中的知识进行规则抽取。该方法充分融合了粗集理论强大的属性约简、规则生成能力和神经网络优良的分类、容错能力。实验表明,该方法快速有效,生成规则简单准确,具有良好的鲁棒性。  相似文献   

13.
作为数据挖掘的重要工具,粗糙集理论被广泛的应用于关系数据库中属性相关性描述、属性集约简、属性重要性度量、规则发现等方面。该文在分析基于信息系统的粗糙集理论的基础上,对基于分辨矩阵的属性约简算法进行了详尽的描述。针对该算法存在的时间和空间性能不理想问题,提出度量单个条件属性对系统概念贡献程度的关联度的概念,以此作为启发式信息对原算法进行改进,得到条件属性的约简。理论分析及实验结果表明该算法具有较好的约简效果及更高的运行效率,为粗糙集理论更广泛地应用于具体的实践提供了一种方法。  相似文献   

14.
Based on the rough set theory which is a powerful tool in dealing with vagueness and uncertainty, an algorithm to mine association rules in incomplete information systems was presented and the support and confidence were redefined. The algorithm can mine the association rules with decision attributes directly without processing missing values. Using the incomplete dataset Mushroom from UCI machine learning repository, the new algorithm was compared with the classical association rules mining algorithm based on Apriori from the number of rules extracted, testing accuracy and. execution time. The experiment results show that the new algorithm has advantages of short execution time and high accuracy.  相似文献   

15.
粗糙集理论中一种属性离散化算法   总被引:6,自引:0,他引:6  
针对定量属性离散化制约粗糙集理论应用这一关键问题,利用分级聚类法和粗糙集理论中依赖度的概念,提出了一种对决策系统中条件属性进行离散化的增类减类算法,实现了决策系统的属性约简。该算法易于理解,计算简单,以实例说明了算法的合理性和有效性。  相似文献   

16.
Rough集是一种处理不精确的、不一致的、不完整的信息,并从中发现隐含的知识,揭示潜在规律的新型方法.Rough集理论的主要思想是在保持分类能力不变的前提下,通过属性约简,删除其中不相关或不重要的知识,从而导出问题的决策或分类规则.概率统计方法是传统数据处理方法,两者各有其优缺点.在决策规则提取过程中,将两者方法结合起来,在满足决策规则力度、肯定因子和覆盖因子的基础上对规则进行筛选,从而提高了决策的准确性和合理性.  相似文献   

17.
针对经典粗糙集理论在解决定性属性、定量属性以及准则属性同时出现的定序分类问题时能力较弱的这种情况,对经典粗糙集理论进行扩展,并给出了一个基于扩展粗糙集的决策分析方法.该方法使用"不可区分-相似-优势"关系来代替经典粗糙集理论中的不可区分关系来获取知识的粗糙近似.实例验证表明该方法不但能够解决上述问题而且还能处理决策表中可能存在的不一致现象,具有较好的有效性与优越性.  相似文献   

18.
基于粗糙集图像分层算法的研究   总被引:2,自引:0,他引:2  
提出了一种基于粗糙集的图像分层新算法,首先从数字图像中提取色彩信息和空间信息构造条件属性集,分析经典的图层信息构造决策属性集,然后运用粗糙集理论进行数据挖掘,从而得到从条件属性集到决策属性集的强规则,运用这些规则对数字图像进行智能分层。最后,用实例证明了该算法的正确性。  相似文献   

19.
决策树是数据挖掘任务中分类的常用方法。在构造决策树的过程中,节点划分属性选择的标准直接影响决策树分类的效果。基于粗糙集的属性频率函数等方法度量属性重要性的概念,将其用于分枝划分属性的选择,提出一种决策树学习算法。该方法仅利用区分矩阵就可以计算出属性的出现频率函数值,计算简单。实验结果表明,用该方法构造的决策树与传统的基于信息熵方法构造的决策树相比较,结构简单,且能有效提高分类效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号