首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 187 毫秒
1.
基于SOAP的分布式数据挖掘系统的设计   总被引:5,自引:3,他引:5  
提出了一种基于SOAP的分布式数据挖掘系统,实现分布式异构环境下的大容量数据的数据挖掘,旨在对异种数据库的数据挖掘进行一些有意义的探讨。  相似文献   

2.
互联网上的大型站点每天都会产生大量的Web应用日志,这些日志中通常蕴藏着丰富且宝贵的信息,单节点的数据挖掘系统已无法满足挖掘海量Web日志的要求.针对该问题,研究利用云计算技术在存储和分析数据的优势,采用分布式数据挖掘方法,验证了以分布式模式挖掘日志较单机的集中模式的效率优势,提高了海量日志挖掘过程中存在的时空效率.  相似文献   

3.
为有效利用高校教育管理工作多年来积累的大量数据,采用数据挖掘技术进行教育信息的关联规则挖掘,设计并实现了一个专门的教育管理数据挖掘系统EMARMiner。实验结果得到了有益于高等学校教育管理决策的挖掘结果。  相似文献   

4.
在文本大数据挖掘过程中受到语义模糊性因素的影响,导致大数据挖掘查准性不好,故提出了一种基于模糊层次聚类分析和语义相似性关联特征提取的大数据挖掘算法.该算法采用泛化映射构造语义概念树,结合二元语义分析方法进行大数据分布式本体模型构建,并采用模糊层次分析方法进行大数据的语义相似性和关联性判断,提取大数据信息流的语义关联特征,结合模糊C均值算法对提取的特征量进行聚类分析,自适应均匀遍历学习方法进行大数据挖掘中关联特征量的信息融合处理,求得挖掘目标函数的最优解,实现大数据优化挖掘.仿真结果表明,采用该算法的语义指向性较好,数据的聚焦性能较优,提高了数据挖掘的查全率和查准率,总体性能稳定可靠.  相似文献   

5.
基于移动代理的层次优化挖掘模型   总被引:1,自引:0,他引:1  
对于大规模分布式数据挖掘问题,提出一种基于移动代理的层次结构挖掘模型,该模型对OIKI DDM模型进行扩展,利用层次设计思想,基于移动代理和增量优化技术进行挖掘和增量集成。实验结果表明该模型对于数据站点大小具有更好的伸缩性,实现更加灵活,可根据网络特点有效降低通讯代价,特别适合于大规模分布式环境。  相似文献   

6.
基于Web的数据挖掘   总被引:4,自引:1,他引:4  
万维网的出现使计算机拥有海量的信息资源,而其中蕴含的知识却未能得到充分的应用,为此Web挖掘技术成为一项重要的研究课题.在深入分析Web上数据信息的特点基础上,着重从功能的角度给出一种用于Web数据挖掘的过程框架,并介绍了伴随数据挖掘的进行,相应的数据信息从web数据到知识模式的演进过程.利用这些Wed挖掘技术可有效挖掘信息.  相似文献   

7.
为了提高对分布式Web日志数据的准确挖掘能力,提出基于用户访问树的分布式Web日志挖掘算法.构建分布式Web日志的信息分布式检测模型,采用模糊信息粗糙集调度方法进行分布式Web日志信息的结构重组,提取分布式Web日志的统计特征量,采用用户访问树特征聚类方法进行分布式Web日志数据的空间分布式重组,结合粗糙集特征匹配方法...  相似文献   

8.
随着信息技术的发展,大量的数据不断被收集和存储,对数据的挖掘规模越来越大,传统的数据挖掘已经无法解决海量数据挖掘问题。网格技术的发展,使得广域分布的海量数据的挖掘问题得到解决。文章根据现实中海量数据挖掘的需求和网格的本质,把并行关联规则挖掘算法应用于网格数据挖掘中,并建立了一个并行数据挖掘模型,验证了并行数据挖掘系统在网格环境的可行性与合理性。  相似文献   

9.
讨论数据挖掘技术中的新分支:网络数据挖掘。针对众多网络信息资源类型,提出KDW的3种数据挖掘任务:基于Web访问的数据挖掘、基于Web结构的数据挖掘、基于Web内容的数据挖掘。介绍了KDW的基本内容和特性。并探讨了XML与web数据挖掘的新技术。  相似文献   

10.
《南京师范大学学报》2008,8(4):F0003-F0003
1.数据挖掘技术及应用方向主要研究各种数据挖掘算法及其在地理信息系统、入侵检测中的应用,包括分布式数据挖掘、空间数据挖掘、图文数据挖掘、web数据挖掘、数据流挖掘等,同时在数据库管理技术、XML数据管理技术及数据预处理方面也作了较深入地研究。该方向已完成的科研项目包括国家自然科学基金3项、省自然科学基金2项及省高校自然科学基金4项。  相似文献   

11.
在不泄露隐私信息或敏感知识的基础下,如何挖掘出分布式数据中准确的规则信息,已成为数据挖掘领域的重要研究方向之一。本文总结了面向分布式数据挖掘的隐私保护技术的现状,并比较分析了不同方法的优缺点,另外还提出了面向数据挖掘隐私保护技术的性能评估标准,展望了未来进一步的研究方向。  相似文献   

12.
针对企业员工综合考评管理信息系统的设计需求,提出了一种基于RBF径向基神经网络的数据挖掘方法,着重讲述了该挖掘方法的构造方案及其在员工考评管理信息系统中的应用。方案首先对员工"德能勤绩"数据仓库进行提炼,抽取形成考评数据挖掘库,然后应用RBF神经网络从大量的员工数据中挖掘有用信息,实现对员工的考评细分,为企业的管理决策提供有力支持。实际应用情况表明了方案的科学性和有效性。  相似文献   

13.
物流园区协同信息平台的数据挖掘模型研究   总被引:1,自引:0,他引:1  
分析了物流园区协同信息平台,提出了物流园区数据挖掘的概念,通过研究园区物流活动,建立了分布式数据仓库结构的数据挖掘技术,并以武汉丹水池物流园区为例进行了案例研究。  相似文献   

14.
针对互联网上数量众多的网站带宽资源长期浪费或突发资源短缺、响应时间长、服务器宕机、网站受到黑客攻击等问题,提出了基于"云"的分布式web安全系统及基于云计算的分布式数据挖掘平台架构,并在此基础上提出了一种新型的分布式数据挖掘模式,利用云计算技术,可以方便地通过网络获取强大的计算能力和存储能力,将消耗大量资源的复杂计算通过网络路由优化和资源约束自适应策略分布到多节点上进行,然后通过组合不同数据站点上的局部数据模型,最终得到全局数据模型。  相似文献   

15.
数据挖掘系统研究   总被引:4,自引:0,他引:4  
结合当前数据挖掘系统发展状况,分别介绍了集中式和分布式的数据挖掘系统,并着重对集中式数据挖掘系统中的各个组成部分及其具体实现技术做了详细的介绍,同时对集中式和分布式的数据挖掘系统目前的发展状况分别做了总结.提出了数据挖掘系统的研究方向和发展趋势:增强可视化和交互性,提高可扩展性,与特定行业应用相结合,遵循统一标准和支持移动环境中数据的挖掘.对数据挖掘系统的发展做了简要的总结和展望.  相似文献   

16.
针对2016年以后的互联网里国内外公开的专利情报领域信息,从专利情报信息的研究方法、研究应用和新技术应用趋势的预测3个方面对专利情报挖掘领域的研究的最新进展进行了论述.对以复杂网络为基础和以时间为基础的方法等方面展开探讨.对于当前的研究缺陷分析从没有充足的实验验证、研究问题的界限不明确、在复杂问题的研究中算法的精确度不...  相似文献   

17.
随着Internet的迅速发展,使得“数据丰富而信息贫乏”这对矛盾显得日益突出,数据挖掘技术正是应了这一需求而结合了机器学习、模式识别、统计学、人工智能、神经网络等多学科而出现的一项新技术,基于Web的数据挖掘是数据挖掘技术在网络信息处理中的应用。本文叙述了Web数据挖掘的概念、分类、技术等,重点讨论了基于XML语言的Web数据挖掘技术,解决了Internet上绝大多数非结构化甚至是无结构的、Web信息的组织结构性差而导致的Web数据挖掘困难的问题。  相似文献   

18.
空间数据挖掘与GIS集成研究及应用   总被引:2,自引:2,他引:2  
如何从复杂的空间数据中提取有价值的信息已经成为一个非常迫切的问题。空间数据挖掘的出现为解决该问题提供了一种新的思路。分析了空间数据挖掘与GIS集戍的必要性与可行性,总结了两者集成模式的3 种形式,提出了一种集成体系结构。该体系结构实现了空间数据挖掘与GIS的完全集成,能够较好地解决空间数据共享以及空间数据可视化问题,从而提高了数据挖掘与知识发现的效率。空间关联规则是空间数据挖掘的一个重要功能,它可以把空间数据库中的数据转化为知识。通过对空间数据信息进行分析,选用数据挖掘中的关联规则算法,实现了该集成结构的工作过程。  相似文献   

19.
介绍了Eclipse插件技术和数据挖掘技术。分析了当今主流的开源数据挖掘平台,通过实验进行对比、整理和归纳。在实验的基础上,提出了解决方案,设计并实现了基于Eclipse插件技术的开源数据挖掘平台。该平台是一个模块化、易于维护和扩展的平台,它的处理单元和数据容器之间没有依赖性,这使得它更加适应分布式环境及独立开发。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号