首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
随着数据挖掘研究领域的蓬勃发展,作为该领域中一个活跃的研究课题的聚类分析也取得了丰硕的成果.本文中分析了聚类分析的概念和分类,并且列举并分析了聚类分析中的经典算法,希望能为相关的研究提供一定的借鉴.  相似文献   

2.
覃宝灵 《广西工学院学报》2007,18(3):105-108,112
聚类分析是数据挖掘的重要概念,它广泛应用于模式识别、图像处理、数据分析和市场研究等领域,但在评价中的应用研究却很少,针对这些问题,把聚类分析技术的基本概念和方法运用于评价,并通过实例阐述其在评价中应用的重要性。  相似文献   

3.
用不分明拓扑的观点探讨了Fuzzy聚类分析,并通过对计量鉴定中一实例的聚类分析,获得了良好的分类效果,为该项问题的研究提供了科学依据.此方法在多元统计分析中具有普遍意义。  相似文献   

4.
5.
把数据挖掘技术引入到智能教学系统中,利用数据总结、分类、聚类等关键技术,为智能教学系统中的潜在的大量聚集的信息进行挖掘和利用,为教师改进教学方式提供教学策略。将其应用到教育系统中,为教育工作者发现教育教学的潜在规律提供教育决策,提高教育教学水平提出了一种新的思路。  相似文献   

6.
拟对各种钢材的品种规格的价格变化之间相关性的分析,运用数据挖掘理论的聚类分析方法,挖掘各种价格指数之间的相关性参数,为预测和分析钢材市场的价格变化提供一种行之有效的方法,提高预测的准确度,预防钢材销售因为价格变化,陷入恶性竞争,提高全行业抵抗来自国内外各种不利因素的风险的能力。  相似文献   

7.
将聚类分析方法引入到证券投资分析中,对上市公司的关键财务数据进行聚类分析,把相应行业板块内的上市公司股票进行分类.通过细小的差别发现这些公司之间的异同,从而为投资者确定投资范和投资价值,最终做出最佳的投资决策.  相似文献   

8.
随着人力资源研究的深入,从数据库中挖掘有用的信息和有帮助的知识,已经成为一个重要的研究领域.本文使用了模糊数据挖掘算法对企业员工绩效考核,掌握了企业员工的构成,对新员工绩效进行预测.  相似文献   

9.
聚类是数据挖掘中的主要方法.讨论了在大多数聚类算法中的相似性测量方法,并以属性的类型作为选择相似性的标准,阐述了用于数值属性,符号属性及混合属性相似性测量方法.  相似文献   

10.
数据挖掘技术是一种新兴的信息处理技术,其算法及应用是目前国际研究热点,在信息的利用和提取中发挥着日益重要的作用。文章在论述数据挖掘技术的基础上探讨了数据挖掘在高校图书馆的应用领域和产生的价值。并重点探讨了数据挖掘技术对馆藏的调整、图书资金的合理分配和为读者提供个性化服务等方面的应用。  相似文献   

11.
数据挖掘技术中聚类算法的改进研究   总被引:1,自引:0,他引:1  
针对K-means算法所存在的问题进行了深入的研究,提出了基于密度和聚类对象方向的改进算法(KADD算法).该算法采取聚类对象分布密度方法来确定初始聚类中心,然后根据对象的聚类方向来发现任意形状的簇.理论分析与实验结果表明,改进算法在不改变时间、空间复杂度的情况下能取得更好的聚类结果.  相似文献   

12.
为了预测毕业生的就业情况,采用聚类分析技术中基于模型的统计方法,参考COBWEB算法,根据历年毕业生的就业情况及相关信息建立数据库,并建立模型进行评估,针对各种因素对学生就业情况造成的影响,对即将毕业的学生进行就业预测。  相似文献   

13.
分析了数据流的特点,针对数据流聚类算法CluStream对数据流中非球形聚类效果不好的情况,提出了基于数据流的不规则网格增量聚类算法IIGStream.IIGStream算法具备了传统网格聚类算法处理速度快的优点.同时能够动态增量地调整网格结构.对新到来的数据点,通过判断网格是否相连,保证了对于不同形状聚类的聚类效果.IIGStream在聚类时无需预先指定聚类数目.且对孤立点不敏感.在真实数据集与仿真数据集上的实验结果表明,IIGStream算法具有良好的适用性和有效性,在聚类精度以及速度上均优于CluStream算法.  相似文献   

14.
应用数据挖掘中的模糊聚类分析方法,从甘蔗种植户数据集中提取种植户的分类知识,得到具有不同种植行为特征的种植户群组,有助于制糖企业了解种植户的分布情况及有针对性地进行种植户行为特征分析,以制定相应的鼓励策略,调动种植户的积极性,使甘蔗种植得到扩大。  相似文献   

15.
混合属性数据聚类的新方法   总被引:1,自引:0,他引:1  
提出了一种数值型和类别型混合属性数据聚类的全局算法。算法通过随机选取足够多的初始原型来覆盖数据集的全局分布信息,然后通过评估函数迭代地消去多余的原型。最后对本文算法进行了验证,证明了该算法的有效性和收敛性。并与其他已有同类型算法的聚类结果进行比较,说明本文算法对混合属性数据具有更高的聚类准确度,为解决混合型数据聚类问题提供了一种新途径。  相似文献   

16.
采用计算机辅助内容分析软件Atlas.ti对开源社区用户学习行为进行定性分析,将分析后的结果导出为特定格式的XML文档,使用DOM对该文档解析后形成二维表形式数据,使之便于在数据库中存储,从而进行进一步的定量分析,为内容分析的后继研究提供了一种新的思路。  相似文献   

17.
An algorithm, Clustering Algorithm Based On Sparse Feature Vector (CABOSFV), was proposed for the high dimensional clustering of binary sparse data, This algorithm compresses the data effectively by using a tool ‘Sparse Feature Vector‘, thus reduces the data scale enormously, and can get the clustering result with only one data scan, Both theoretical analysis and empirical tests showed that CABOSFV is of low computational complexity. The algorithm finds clusters in high dimensional large datasets efficiently and handles noise effectively.  相似文献   

18.
一种基于相似度概率的不确定分类数据聚类算法   总被引:1,自引:1,他引:0  
针对不确定分类数据,基于Squeezer算法提出一种有效的不确定数据聚类算法:USqueezer算法。该算法先计算一个不确定分类数据与每个簇的相似度概率和,选取最大的相似度和给定的阈值相比较,若大于阈值,将不确定数据划分到该簇中,否则创建一个新簇。实验表明,USqueezer算法能够有效地进行不确定分类数据的聚类,并且占用较少的运行内存空间和运行时间。  相似文献   

19.
介绍数据挖掘技术及其在医院信息管理中的应用.  相似文献   

20.
基于云计算平台的数据挖掘主要目的是为了更好地处理海量数据,挖掘有用的信息.云计算为海量数据挖掘提供了强大的数据收集、存储和计算能力,简述了云计算技术及其研究现状,详细介绍了基于云计算平台的聚类算法,总结在云计算平台研究聚类所遇到的新问题,对基于云计算平台的聚类发展趋势进行展望.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号