首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 31 毫秒
1.
DMVisualMiner:一个可视化数据挖掘分析平台   总被引:1,自引:0,他引:1  
DMVisualMiner是将可视化技术应用于数据挖掘领域而开发的一个数据分析平台.可视化数据挖掘主要应用在4个方面数据准备阶段的可视化、模型生成阶段的可视化、结果呈现阶段的可视化、数据挖掘流程的可视化.实现了对数据挖掘各个方面的可视化,同时DMVisualMiner采用构件的设计方法,利用插件的概念增强了系统的可扩展性,设计并实现了基于XML的模型表示方法,使得DMVisualMiner能够和预言模型系统集成,并能在网络环境下发布.  相似文献   

2.
基于MapReduce的决策树算法并行化   总被引:1,自引:0,他引:1  
陆秋  程小辉 《计算机应用》2012,32(9):2463-2465
针对传统决策树算法不能解决海量数据挖掘以及ID3算法的多值偏向问题,设计和实现了一种基于MapReduce架构的并行决策树分类算法。该算法采用属性相似度作为测试属性的选择标准来避免ID3算法的多值偏向问题,采用MapReduce模型来解决海量数据挖掘问题。在用普通PC搭建的Hadoop集群的实验结果表明:基于MapReduce的决策树算法可以处理大规模数据的分类问题,具有较好的可扩展性,在保证分类正确率的情况下能获得接近线性的加速比。  相似文献   

3.
随着互联网的飞速发展,需要处理的数据量不断增加,在互联网数据挖掘领域中传统的单机文本聚类算法无法满足海量数据处理的要求,针对在单机情况下,传统LDA算法无法分析处理大规模语料集的问题,提出基于MapReduce计算框架,采用Gibbs抽样方法的并行化LDA主题模型的建立方法。利用分布式计算框架MapReduce研究了LDA主题模型的并行化实现,并且考察了该并行计算程序的计算性能。通过对Hadoop并行计算与单机计算进行实验对比,发现该方法在处理大规模语料时,能够较大地提升算法的运行速度,并且随着集群节点数的增加,在加速比方面也有较好的表现。基于Hadoop平台并行化地实现LDA算法具有可行性,解决了单机无法分析大规模语料集中潜藏主题信息的问题。  相似文献   

4.
对数据挖掘算法以及MapReduce分布式计算模型进行了简要的分析,详细地阐述了数据挖掘算法中最为常见的Apriori算法在云数据平台下的实现.  相似文献   

5.
MapReduce是云计算技术主流的分布式计算模型,它充分利用计算机集群的处理能力;能对大规模数据进行高效的挖掘分析;在研究MapReduce模型架构的基础上,将云计算技术与数据挖掘技术结合在一起,提出了基于MapReduce模型的Apriori算法;该算法对事务集和项集进行双重二进制编码,只需"与"运算和"或"运算,提高了模式匹配和连接的效率;试验结果表明,该算法执行效率比传统集中式Apriori算法有很大幅度的提高。  相似文献   

6.
文献显示对在线教学平台进行数据挖掘可产生良好的作用。本研究依托一个高校在线教学平台的教学数据,针对该教学平台已有数据分析功能的缺陷,采用教育数据挖掘中的“统计和可视化”方法,开发了一套基于Springboot的在线学习服务可视化分析系统,通过可视化分析展示了该平台投入运行以来的整体情况,以期为教学管理部门提供较为可靠的决策参考。最后总结可视化在高校在线教学系统的教育数据挖掘中的应用方法,以及研究的局限性。  相似文献   

7.
信息可视化技术可以帮助我们加深对大规模复杂数据和信息间相互关系的理解, 而三维技术为信息可视化领域带来了新思路. 本文根据杭州工艺美术博物馆虚拟博物馆三维展厅浏览和藏品知识点信息浏览的可视化需求, 设计并实现了藏品信息可视化系统. 该系统基于Unity3D开发平台搭建, 根据杭州工艺美术博物馆虚拟博物馆藏品信息可视化需求分别设计实现相应的三维可视化组件, 通过Web3D客户端技术实现了用户通过浏览器高速、便捷地浏览博物馆三维可视化信息的功能需求.  相似文献   

8.
移动智慧课堂可视化平台的稳定性较差,数据挖掘能力不高,为此提出基于大数据分析的移动智慧课堂可视化平台。硬件方面,在MapReduce中构造多层次并行处理机制,结合图形处理器(Graphics Processing Unit,GPU)和中央处理器(Central Processing Unit,CPU)进行多种并行形式计算。软件方面,设计数据库缓存架构模块,部署多个Redis节点,设计Echarts图形库组件模块,选择组件化将基本数据结构转变为数据可视化页面。实验结果表明,在并发环境中,该平台具有良好的稳定性,挖掘数据的时间最短,符合预期效果。  相似文献   

9.
分析了数据挖掘中可视化技术应用的特点与方法,给出了数据挖掘中可视对象与参数的确定及算法分解的方法,提出了一种基于平行坐标技术的度量指标体系,证明了其中的相关性质与结论,并给出基于平行坐标技术的度量模型以及在实验数据上的应用例.结果表明这种方法对于数据挖掘中的数据可视化表示是有效的.基于度量指标的可视化技术在对可视对象的分析处理上可以借助适用的数学方法建模与评测,这有助于数据挖掘可视化的研究与应用.  相似文献   

10.
为减缓交通拥挤,降低污染物排放,提出基于GPS数据可视化的拼车系统体系结构,讨论城市交通路网构建、用户路径信息获取、匹配方案查询、空间数据可视化的设计与实现方法。在此基础上,基于.NET平台开发一套基础软件,基于Processing平台开发拼车信息数据可视化系统。对沈阳市500名真实用户的出行路线进行的分析测试验证了该智能拼车系统的可行性及实用性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号