排序方式: 共有8条查询结果,搜索用时 15 毫秒
1
1.
2.
介绍K-means、DBSCAN、EM、Farthest First等4种常用的聚类算法,并在WEKA中使用这些算法对Iris数据集进行了聚类实验。实验结果表明,与DBSCAN、EM、Farthest First等聚类算法相比,K-means算法在误判率、运行时间、生成簇数、迭代次数方面与人工判断的吻合度最高。 相似文献
3.
4.
C4.5算法是用于生成决策树的一种经典算法,虽然其有很强的噪声处理能力,但当属性值缺失率高时,分类准确率会明显下降,而且该算法在构建决策树时,需要多次扫描、排序数据集、以及频繁调用对数,针对以上缺点,本文提出一种改进的分类算法.采用一种基于朴素贝叶斯定理方法,来处理空缺属性值,提高分类准确率.通过优化精简计算公式,在计算过程中,改进后的计算公式使用四则混合运算代替原来的对数运算,减少构建决策树的运行时间.为了验证该算法的性能,通过对UCI数据库中5个数据集进行实验,实验结果表明,改进后的算法极大的提高了运行效率. 相似文献
5.
Web 信息抽取方法研究 总被引:1,自引:1,他引:0
web 资源含有大量的有用信息,但由于它们欠结构化,不能为传统的数据库型查询系统所利用。如何将这些信息抽取出来,转化成结构化信息,供其它信息集成系统所利用,成为该顶域的研究热点。本文介绍了一个简单的web 信息抽取模型,以及基于该模型研究。 相似文献
6.
韩存鸽 《重庆理工大学学报(自然科学版)》2012,(11)
介绍了聚类挖掘的基本理论。对武夷学院图书馆提供的流通数据进行了聚类分析,主要采集读者借阅册数和图书流通量2类数据,在Clementine中使用K-means模型从读者的借阅册数角度进行分类,将读者划分成"活跃读者""消极读者"及"一般读者"3类。根据图书流通量进行分类,将图书分成"热门书""冷门书"及"一般书"3类。根据聚类挖掘的结果,为不同类的读者提供不同的服务,针对不同类的图书采取相应的措施。 相似文献
7.
韩存鸽 《湖南工业大学学报》2019,33(5):57-61
对福建某高校二级学院2016年毕业生就业信息进行预处理,从统计分析、构建决策树模型两方面开展研究。在Weka中采用C4.5(J48)算法构建了决策树,根据分析及构造的决策树模型,从人才培养方案、奖励制度、在校学生的就业规划提出了相关建议,为就业指导部门和高校领导提供一定的决策帮助。 相似文献
8.
统计分析及关联挖掘在高校图书馆流通数据中的应用 总被引:1,自引:0,他引:1
对武夷学院图书馆提供的连续一年的借阅数据进行了预处理,从统计分析、关联关联挖掘两个方面展开工作,根据分析结果,从馆藏布局、图书采购、图书馆工作人员的人力、工作时间安排上给出相关的建议,帮助图书馆做好图书推荐工作。 相似文献
1