首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 124 毫秒
1.
基于决策树的就业数据挖掘   总被引:12,自引:0,他引:12  
针对学生就业问题,给出了就业数据挖掘模型.决策树方法是数据挖掘中非常有效的分类方法,根据就业数据特点,采用了C4.5决策树算法.C4.5算法是决策树核心算法ID3的改进算法,它构造简单,速度较快,容易实现.模型对就业数据预处理,选取决策属性,实现挖掘算法并抽取规则知识,由规则知识指出哪些决策属性决定了就业单位的类别,挖掘结果表明,该算法能够正确将就业数据分类,并得到若干有价值的结论,供决策分析。  相似文献   

2.
为充分挖掘隐藏于遥测数据中的规则知识,发现数据间的关联性,采用ID3算法对卫星太阳帆板遥测数据进行挖掘分析,计算各类参数的信息增益值,以最大增益值为分裂属性构建出相关性决策树,得到决策知识,发现影响太阳帆板状态变化的参数间的关联性,为卫星在轨性能分析和故障诊断提供依据.分析结果表明,采用ID3算法对遥测数据进行分析可以获得预期的结果.  相似文献   

3.
数据挖掘技术在高校学生就业指导决策中的运用   总被引:1,自引:0,他引:1  
高校学生的招生、就业等信息数量庞大,表目繁多,对这些数据有效地进行预处理,并进一步挖掘以获得有利于高校教学管理决策和毕业生就业指导的有用信息,具有重要意义.以沈阳市某高校学生招生就业数据为基础,建立了一个基于学生信息的关联规则挖掘系统,并对其中的Apriori算法进行优化,同时对由频繁项集生成关联规则的算法给予改进,挖掘结果中产生了大量有益信息,通过实际检验,该优化算法能避免大量无意义关联规则的产生并提高挖掘效率.  相似文献   

4.
企业信息系统中收集到的大量数据往往是不完备的,引入相似关系定义不完备信息系统的分明矩阵,采用分明矩阵的简化方法计算约简,对每个约简中的不完备数据,按照对象条件属性值相对决策属性取值的先验概率进行完备化,完备化后的信息系统生成了一组决策规则,这些规则不但存在冗余而且规则解释能力低,按照特征描述逐步挖掘规则并给出了挖掘所有最简决策规则的算法.整个过程中,通过客户信息资料描述一系列过程,验证了新的信息系统完备化方案以及挖掘算法的合理性和有效性.  相似文献   

5.
粗糙集理论处理高层建筑方案设计知识发现问题时,须对样本属性逐次处理,导致挖掘速度缓慢,针对这一缺点,采用一种基于概念普遍化和粗糙集的数据发掘算法,利用概念普遍化和粗糙集对数据进行压缩和维数精简的特长,利用知识归纳的方法压缩信息表中数据,再用标准粗糙集理论对表中数据进行属性约简、合并,从而导出决策规则.根据实际需要对信息表中的数据进行处理,达到高效发掘感兴趣模式的目的.并给出一个应用实例.  相似文献   

6.
基于归纳逻辑程序设计的特异规则挖掘   总被引:3,自引:0,他引:3  
从关系数据挖掘的角度提出了挖掘特异规则的方法,该方法通过面向属性的方法来识别特异数据.借鉴Chi2算法的思想实现了特异数据的离散,并定性地描述了数据的特异程度,结合经典的归纳逻辑程序设计系统FDIL,自然地挖掘出了特异规则,突破了传统命题级数据挖掘的框架.试验结果表明利用该方法能够发现被传统的关联规则挖掘算法所忽略的有价值的知识.  相似文献   

7.
在分析几种现有关联规则算法的基础上,针对网络数据的具体情况,引入关键属性、参考属性以及属性相对支持度的约束,对关联规则挖掘算法FP_Growth进行了扩展,解决了基本关联规则挖掘算法中产生大量无用模式的问题,从而帮助系统发掘出更有意义的模式,提高了系统挖掘的执行效率和规则库的准确度.  相似文献   

8.
粗糙集在数据挖掘分类规则中的应用研究   总被引:5,自引:0,他引:5  
数据集中的冗余性会降低数据挖掘结果的解释能力和精度,介绍了数据集中挖掘分类规则的基本原则,并利用粗糙集理论中核及决策类覆盖的概念,提出了一个在数据集中发现没有冗余属性的最小归纳依赖关系,并简化带有不同相容规则的决策系统的数据挖掘算法,并应用一简单的例子说明如何在数据库中发现分类规则。  相似文献   

9.
用知识发现的思想来解决决策型工艺知识获取问题。定义了工艺决策数据表(PDDT)的概念,用它存储工艺决策数据样本,并基于CLS(Concept Learning System)算法提出了一种改进的工艺决策树学习算法,采用ID3(Iterative Dichotomizer 3)算法来度量工艺决策数据表中条件属性对于工艺决策规则的重要性,进而构建工艺决策树,提出了工艺决策树简化处理的原则以及转换为工艺决策规则的方法。  相似文献   

10.
通过研究基于两阶段频集思想的Apriori算法,针对Apriori算法的性能瓶颈提出了改进的Apriori算法,利用改进的Apriori算法对乳腺疾病数据进行挖掘,使用SQLServer2005数据挖掘工具,主要建立肿瘤复发和其他属性间的关联规则.挖掘结果证明了关联规则算法在医疗数据挖掘中的有效性.  相似文献   

11.
高校大学生就业记录蕴含着丰富的信息,通过对某高校2008~2010年大学生就业记录数据进行数据挖掘,分析大学生个人属性与其就业产业的关联度。基于数据挖掘Apriori算法对大学生性别、学历、所在院系及所学专业等个人属性与就业产业进行关联度分析,结果表明:大学生个人属性与就业产业之间具有明显的关联性,学历越高越倾向于选择第三产业就业,并且女大学生选择第三产业就业的倾向较之男大学生更明显。  相似文献   

12.
一种基于信息熵建立决策树的算法   总被引:2,自引:0,他引:2  
信息论给出了信息的数学本质,提出了用热力学中的熵来度量信息量的大小。分类是一个重要的数据挖掘问题,在训练数据集上建立分类树的关键是如何选择决策树每一个内部结点的测试属性。传统的决策树建立算法利用信息论中熵的概念选择属性,具有偏向于取值较多属性的缺点。本文分析了信息论中有关熵的一些基本概念和含义,讨论了它们在挖掘分类树中的应用,利用互信息设计了一个建立分类树的算法,克服了传统算法的缺点。  相似文献   

13.
利用数据挖掘技术对当前毕业生的就业数据进行分析,发现影响就业的主要因素.其中使用C4.5算法计算了学业成绩、社团实践、获奖情况等分裂属性的增益率,以此构造决策树并对其归纳总结出一些就业规则.  相似文献   

14.
基于粗集理论的约简算法   总被引:5,自引:0,他引:5  
在基于属性重要性和基于分辨矩阵两种算法的基础上,提出了一种同时满足属性重要性和频度的启发式约简算法RedFreSigni。该算法的基本思想是:以属性的核为基础,把核和用户偏好集同时作为属性近似约简的一部分,以频度作为选择属性的启发信息可同时生成计算属性的频度信息与不可分辨矩阵,减少了计算时间。在此基础上进而提出了基于规则支持度和置信度的决策挖掘算法,该算法能有效提取出用户感兴趣的规则。  相似文献   

15.
为了应对微信息舆情数据的格式复杂、价值稀疏和收集困难等大数据处理技术难题,基于隐含语义分析和粗糙集近似约简理论,设计微信息的数据区间值集和近似匹配分类算法.在不影响数据主要关联关系的原则下,提炼核心属性、消减次要属性,实现一种微信息异常主题倾向的发现方法.结果表明,该近似约简算法能在完成微信息兴趣倾向主题分类的前提下,将数据集属性大幅度缩减,提高微信息的信息挖掘效率,为微信息大数据舆情处理工作提供了新的思路和案例.  相似文献   

16.
保持隐私的朴素贝叶斯分类   总被引:3,自引:0,他引:3       下载免费PDF全文
隐私保护是数据挖掘中很有意义的研究方向。本文所关心的问题是如何在两个私有数据库的联合样本集上施行数据挖掘算法,同时保证不向对方泄露任何与结果无关的数据库信息。这种情形在科研合作等领域已经屡见不鲜。针对数据分类算法中应用非常普遍的朴素贝叶斯分类算法,我们利用安全两方计算协议,给出一个保持隐私的朴素贝叶斯分类协议,在保持计算隐私性的同时,协议在计算复杂度和传输复杂度与一般的贝叶斯分类非常接近,协议是高效可行的。  相似文献   

17.
针对传统分类方法的局限性,提出了一种深度学习结合知识挖掘的零样本图像自适应控制图像分类算法.利用对图像属性的深度学习来实现图像深层次特征及属性的学习和预测,基于图像的属性-类别映射使分类器性能有较大差异,通过稀疏表示模型挖掘图像类别和属性之间的关系并设计自适应控制的属性分类器实现对图像的分类操作.结果表明,与DBN和SVM算法相比,在监督模式和零样本模式下,该算法具有较高的属性预测准确度.在零样本情况下对Shoes数据集进行分类时,该算法具有最高的准确分类识别率,比其他算法的分类识别率提高了15%.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号