首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 74 毫秒
1.
数据挖掘技术在远程教育教学中的应用   总被引:1,自引:0,他引:1  
数据挖掘是一种新兴的信息处理技术,在信息的利用和提取中发挥着日益重要的作用.简要介绍了数据挖掘技术.给出了一个完整的数据挖掘系统设计与实现过程.它包括数据的准备与选择、数据的预处理、挖掘算法的选择与实现、挖掘结果的描述四个步骤.文中详细介绍了上述各个步骤的处理过程,并通过改进Apriori算法来提高挖掘的效率,为远程教育教学决策提供了科学依据.  相似文献   

2.
本文简述了数据挖掘的概念、数据挖掘系统、数字挖掘步骤以及数据挖掘服务的实现。  相似文献   

3.
智能WEB信息提取系统的研究和设计   总被引:2,自引:1,他引:2  
XML业已成为WEB数据发布与交换的标准,包装器技术为数据挖掘提供了重要实现步骤,智能代理技术以其智能、代理特性在控制协调挖掘上起着重要作用.本文将这三项标准和技术进行有机结合,应用于WEB数据挖掘上,借助J2EE三层体系结构思想,给出了智能WEB信息提取实现方案,并简要阐述了该系统处理用户挖掘请求的流程,体现了该系统较强的智能理解和概括能力.  相似文献   

4.
介绍了一种基于数据挖掘技术的机械设备故障诊断方法,介绍了数据挖掘技术在故障诊断中的实现步骤.以数据挖掘系统在煤矿风机监控系统中的应用为例,建立了数据挖掘模型,详细论述了关联规则方法的挖掘过程,对挖掘结果进行了分析,表明此方法可以很好的对设备故障进行预警.  相似文献   

5.
数据挖掘在销售管理系统中的设计和实现   总被引:4,自引:0,他引:4  
面对企业销售部门日益增长的海量数据,给出了一个完整的销售管理数据挖掘系统,它包括数据的准备与取样、数据调整、挖掘算法的实现、结果的评价等步骤。结合某公司的实例,进行了详细的分析和说明。  相似文献   

6.
石油工业大数据具有无限潜力与价值,将大数据与数据挖掘技术应用其中,不仅可以提升石油行业工业化水平,而且对石油行业智慧化发展起到强有力地推动作用.由此提出了一个Web架构驱动的、集成了数据挖掘五大模块的新型工业知识挖掘系统-即石油工业数据挖掘系统,包含:数据集管理、预处理算法管理、数据挖掘算法管理以及数据挖掘流程管理和数据结果可视化五大模块.本系统实现了完全自助式的数据提取、数据预处理、数据分析与知识挖掘和结果可视化展示的完整知识挖掘流程.通过以Web的形式满足油田不同层级的用户在不同场景下的即时使用需求,极大提高了系统的灵活性.通过本系统,油田的技术开发人员可忽略大数据的搭建以及其他复杂构建过程,更好的服务于油田数据建模和分析.  相似文献   

7.
研究基于机器学习的地震异常数据挖掘方法.在进行地震异常数据挖掘过程中,由于地震监测系统信号时变性及监测环境的不稳定性,采用传统的方法进行挖掘,其挖掘的精确度较低.为此,提出基于机器学习的地震异常数据挖掘方法.根据机器学习的相关理论获取标准方程组和最小均方误差值,实现异常数据挖掘最优模型的构建,通过计算数据的特征向量,建立地震监测数据特征库,依据获取的概率值实现对监测数据的正确判断,从而完成对地震异常数据的有效挖掘.实验结果表明,利用基于机器学习的地震异常数据挖掘方法,能够有效的提高地震异常数据的挖掘准确度与挖掘效率,保证了地震监测系统的有效性.  相似文献   

8.
一个面向大规模数据库的数据挖掘系统   总被引:18,自引:0,他引:18  
钱卫宁  魏藜  王焱  钱海蕾  周傲英 《软件学报》2002,13(8):1540-1545
数据挖掘融合了数据库技术、人工智能和统计学,是目前的研究热点.为了能够集成当前数据挖掘的主要技术并使它们协同工作,在进行数据挖掘基本算法研究的基础上研制开发了一个数据挖掘系统--Golden-Eye.系统实现了在数据挖掘研究中的一些最新成果,集成了泛化、数据清洗这两个数据准备操作以及关联规则发现、例外规则发现、时序模式发现、分类器构造、聚类分析等基本数据挖掘操作,并实现了对挖掘操作的基本管理和结果的图形化显示.整个框架设计充分体现了系统的完整性、协调性和高效性:自底向上将存储控制模块、数据预处理模块、挖掘操作模块、挖掘库管理模块有机地结合在一起,在底层实现了对包括中间结果在内的数据的统一管理,在上层为用户提供了可视化的界面.实验结果表明,该系统能够在大规模数据库上成功地完成用户所指定的数据挖掘操作.  相似文献   

9.
基于多Agent系统的Web数据挖掘技术   总被引:1,自引:0,他引:1  
李艳芳 《计算机工程与设计》2007,28(6):1267-1268,1272
基于多Agent系统的数据挖掘技术,能够综合应用多种挖掘算法,实现数据挖掘的并行操作.在简述了几种主要的数据挖掘技术的基础上,提出了一种基于多Agent系统的Web数据挖掘模型,进一步分析了系统组织和成员间的协作,并测试了其挖掘效果.测试结果显示,此项技术的挖掘效果具有较好的准确率和覆盖率.  相似文献   

10.
智能WEB信息提取系统的研究和设计   总被引:3,自引:0,他引:3  
XML业已成为WEB数据发布与交换的标准,包装器技术为数据挖掘提供了重要实现步骤,智能代理技术以其智能、代理特性在控制协调挖掘上起着重要作用。本文将这三项标准和技术进行有机结合,应用于WEB数据挖掘上,借助J2EE三层体系结构思想,给出了智能WEB信息提取实现方案,并简要阐述了该系统处理用户挖掘请求的流程,体现了该系统较强的智能理解和概括能力。  相似文献   

11.
王荣  陈纯 《计算机应用与软件》2007,24(11):98-99,113
数据挖掘是从海量数据中提取隐含在其中的、针对某些用户的信息的高级处理过程.属性选择是数据挖掘领域非常重要的一个研究方向,属性选择的好坏对挖掘的性能和结果有着很大的影响.提出了一种新的属性选择算法,即基于信息增益和卡方检验的属性选择算法,并在离网预测模型中得到了应用,取得了相当不错的效果.  相似文献   

12.
The insurance industry of Hong Kong has been experiencing steady growth in the last decade. One of the current problems in the industry is that, in general, insurance agent turnover is high. The selection of new agents is treated as a regular recruitment exercise. This study focuses on the characteristics of data warehousing and the appropriate data mining techniques that can be used to support agent selection in the insurance industry. We examine the application of three popular data mining methods – discriminant analysis, decision trees and artificial neural networks – incorporated with a data warehouse to the prediction of the length of service, sales premiums and persistence indices of insurance agents. An intelligent decision support system, namely Intelligent Agent Selection Assistant for Insurance, is presented, which will help insurance managers to select quality agents by using data mining in a data warehouse environment.  相似文献   

13.
为提高数据挖掘服务选择的匹配度,提出了一种基于数据挖掘本体的带QoS约束的数据挖掘服务选择方法。方法引入了数据挖掘服务本体,给出了数据挖掘服务描述模型,定义了一种基于数据挖掘本体和QoS约束的数据挖掘服务匹配层次分类方法和服务匹配度计算方法,有效解决了数据挖掘服务选择中服务匹配的问题。实验表明,该方法可行且具有较高的查全率和查准率。  相似文献   

14.
This paper introduces concepts and algorithms of feature selection, surveys existing feature selection algorithms for classification and clustering, groups and compares different algorithms with a categorizing framework based on search strategies, evaluation criteria, and data mining tasks, reveals unattempted combinations, and provides guidelines in selecting feature selection algorithms. With the categorizing framework, we continue our efforts toward-building an integrated system for intelligent feature selection. A unifying platform is proposed as an intermediate step. An illustrative example is presented to show how existing feature selection algorithms can be integrated into a meta algorithm that can take advantage of individual algorithms. An added advantage of doing so is to help a user employ a suitable algorithm without knowing details of each algorithm. Some real-world applications are included to demonstrate the use of feature selection in data mining. We conclude this work by identifying trends and challenges of feature selection research and development.  相似文献   

15.
李云 《微型机与应用》2012,31(15):1-2,5
特征选择是机器学习和数据挖掘领域的关键问题之一,而特征选择的稳定性也是目前的一个研究热点。主要对特征选择的稳定性因素和稳定性度量进行分析,并详细介绍了目前比较经典的两种提高特征选择稳定性的方法。  相似文献   

16.
基于VPRSM的音频特征选择   总被引:1,自引:0,他引:1  
在音频索引中保持音频特征非常重要,但是在很多情况下特征数量又很庞大,直接处理这些海量数据是非常耗时的.特征选择作为数据挖掘的一个处理步骤,在特征维数的减少和非相关数据的约简方面已经有很成功的使用.提出了一种基于变精度粗糙集模型(variable precision rough setmodel,VPRSM)的音频特征选择算法.实验结果表明,该算法能够得到最小约简,并且最大程度地保持了音频数据的特征,提高检索效率.  相似文献   

17.
Feature Subset Selection within a Simulated Annealing Data Mining Algorithm   总被引:2,自引:0,他引:2  
An overview of the principle feature subset selection methods isgiven. We investigate a number of measures of feature subset quality, usinglarge commercial databases. We develop an entropic measure, based upon theinformation gain approach used within ID3 and C4.5 to build trees, which isshown to give the best performance over our databases. This measure is usedwithin a simple feature subset selection algorithm and the technique is usedto generate subsets of high quality features from the databases. A simulatedannealing based data mining technique is presented and applied to thedatabases. The performance using all features is compared to that achievedusing the subset selected by our algorithm. We show that a substantialreduction in the number of features may be achieved together with animprovement in the performance of our data mining system. We also present amodification of the data mining algorithm, which allows it to simultaneouslysearch for promising feature subsets and high quality rules. The effect ofvarying the generality level of the desired pattern is alsoinvestigated.  相似文献   

18.
本文针对交通数据挖掘领域的交通流预测问题进行研究和实现.主要对数据挖掘技术应用于交通流数据的特征选择和交通流预测模型的建立提出算法.在对采样数据进行清洗后,以分类与回归决策树作为基学习器,采用梯度提升决策树进行回归拟合,计算出交通数据的特征重要度.并以此重要度作为自适应特征选择的依据.其次,采用聚类算法对选取后的特征数据进行聚类分析,缩小样本大小的同时,同类数据更加相似.最后,以实时数据匹配相应聚类作为训练数据集,使用经过人工鱼群算法优化参数后的支持向量机进行交通流预测.本文结尾通过实验数据论证本文所提出的算法和模型.  相似文献   

19.
基于组合服务执行信息的服务选取方法研究   总被引:7,自引:0,他引:7  
组合服务选取问题是服务计算领域的一个研究热点问题,已往的选取方法大多基于难以准确获取的服务QoS信息,且算法思路复杂.文中提出了一种基于组合服务执行信息的服务选取方法.该方法分为3个阶段:数据生成阶段、数据挖掘阶段和服务选取阶段,分别进行组合服务执行信息的记载和相关数据集的生成、路径分支关联规则和服务执行顺序序列模式的挖掘以及基于挖掘产生的知识模式进行服务选取.文中首先给出一种可以方便记载日志的服务组合系统架构;然后提出一种基于时间加权的算法模型,以有效地进行路径分支关联规则和顺序序列模式的挖掘;最后对文中的组合服务选取方法进行描述.实验结果表明:文中方法在选取出的组合服务健壮性方面要优于基于QoS的方法.  相似文献   

20.
针对目前在搜索方面的数据量大、搜索延迟的特点,提出了基于云计算的Web挖掘的搜索模型.采用提出的基于Map/Reduce模型的改进型算法,通过仿真实验验证了该算法的可行性,在一定程度上减少了搜索的代价,提高了搜索效率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号