首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
基于矩阵的增量式关联规则挖掘算法   总被引:1,自引:1,他引:0  
关联规则是数据挖掘的重要研究内容之一。针对数据库数据增加的同时最小支持度发生改变的关联规则更新维护问题,提出了一种基于矩阵的增量式关联规则挖掘算法IUBM。该算法采用简单的数组和位运算,在执行关联规则的更新时,既不用多次扫描数据库,也不产生庞大的候选项集。实例表明,该算法的时间复杂度和空间复杂度大大降低。  相似文献   

2.
关联规则的高效挖掘算法研究   总被引:4,自引:0,他引:4  
关联规则的挖掘是一个重要的数据挖掘问题,对其挖掘算法的研究具有十分重要的意义,经典的关联规则发现算法是一个多次遍历的算法,计算的复杂度较同,本文给出一种关联规则频繁数据集的发现算法,只需对交易序列扫描两次即可发现数据采的频繁数据集,算法效率得到了较好地提高。  相似文献   

3.
数据挖掘是关联规则中一个重要的研究方向。该文对关联规则的数据挖掘和遗传算法进行了概述,提出了一种改进型遗传算法的关联规则提取算法。最后结合实例给出了用遗传算法进行关联规则的挖掘方法。  相似文献   

4.
数据挖掘是关联规则中一个重要的研究方向。该文对关联规则的数据挖掘和遗传算法进行了概述,提出了一种改进型遗传算法的关联规则提取算法。最后结合实例给出了用遗传算法进行关联规则的挖掘方法。  相似文献   

5.
为解决传统关联聚类算法挖掘网络异常数据时间复杂度高、精确度不理想等问题,提出Spark-MML聚类算法。为Apriori关联规则算法设计并行化频繁项集挖掘环境,使用兴趣度约束与支持度自适应策略挖掘网络数据特征量强关联规则;利用可变网格的局部离群点检测算法剔除K-means聚类离群点,基于最大最小距离确定聚类中心及数值K,将网络数据分为异常和非异常。测试结果表明,该方法避免聚类中心选取陷入局部最优,降低了异常数据挖掘的时间复杂度,有效节约算法运行空间,是一种可靠的网络异常数据挖掘方法。  相似文献   

6.
针对动态安全模型理论P2DR,本文在入侵检测技术中应用了关联规则数据挖掘算法,并适当改进了Apriori算法。该算法对关联规则进行强有力的压缩,减少了结果集中规则的数目。实验结果表明,改进的算法能够有效压缩关联规则数目,提高算法效率,适用于网络数据挖掘,并能有效地减少入侵检测技术中的误报率和漏报率。  相似文献   

7.
关联规则挖掘中增量式更新算法的研究   总被引:8,自引:1,他引:8  
关联规则的更新是数据挖掘技术中的一个重要内容,能否有效地挖掘出动态事务数据库中的频繁项目集或关联规则是衡量一个算法好坏的关键因素。该文系统地介绍了关联规则的增量式更新问题,给出或提出了相应的算法,并举例说明了算法的执行过程。  相似文献   

8.
数据挖掘过程中只考虑数据项权重或者只考虑时态语义会导致挖掘结果不全面。针对该问题,对加权关联规则、时态关联规则和时态数据周期规律进行研究,将权值、K-支持期望和周期等概念引入到时态关联规则中,提出一种基于周期规律的加权时态关联规则挖掘算法。以某管理系统审计数据为例进行实验验证,结果表明该算法能够准确地挖掘出数据库中的加权时态关联规则,与加权关联规则算法相比,在时间复杂度相同的情况下能使关联规则的挖掘结果更加全面。  相似文献   

9.
关联规则挖掘是数据挖掘中的一个重要任务,传统关联规则挖掘方法计算复杂度高、效率较低,而智能算法在搜索过程中具有保持种群多样性、鲁棒性等优点。本文提出基于免疫克隆文化算法的关联规则挖掘模型,该模型将免疫克隆算法嵌入到文化算法的框架中,利用免疫克隆算法的全局收敛性在数据库中迅速搜索频繁项目集,进而提取用户感兴趣的关联规则;利用文化算法信念空间的知识结构指导种群的进化,增强了搜索的目的性和方向性。实验表明,该模型具有较快的运行速度,提高了所得关联规则的准确率。  相似文献   

10.
针对FP算法的缺陷,将OLAP技术和Apriori关联规则相结合,提出一种针对FP算法的改进的多层次关联规则数据挖掘算法,在分析关联规则数据挖掘结构的基础上,给出该算法的思想与执行步骤,对于关联规则数据挖掘的研究具有一定的理论意义.  相似文献   

11.
针对现有关联规则挖掘算法大多是挖掘一种静态关联规则的情况,介绍动态关联规则的定义,给出动态关联规则元规则的形式化定义,解决规则随时间的推移可能会有很大变化的情况下为规则建立元规则的问题,描述一种基于时间序列模型的预测和分析动态关联规则的元规则的方法,从而较好地拟合历史数据,给出满足一定显著性水平预测趋势模型的方程,挖掘规则的变化趋势,为规则建立元规则。  相似文献   

12.
一种时间序列快速分段及符号化方法   总被引:1,自引:0,他引:1  
任江涛  何武  印鉴  张毅 《计算机科学》2005,32(9):166-169
作为一类重要的复杂类型数据,时间序列已成为数据挖掘领域的热点研究对象之一.针对时间序列的挖掘通常首先需要将时间序列分段并转变为种类有限的符号序列,以利于进一步进行时间序列模式挖掘.针对当前的时间序列分段方法复杂度较大,效率不高等问题,本文提出了一种简单高效的基于拐点检测的时间序列分段方法,并且采用动态时间弯曲度量计算不等长子序列的相异度,最后运用层次化聚类算法实现子序列的分类及符号化.实验表明,本文所提出的方法切实可行,实验结果具有较为明显的物理意义.  相似文献   

13.
针对动态关联规则趋势度随时间变化的特点,在分析原有定义以及对动态关联规则趋势度建立预测模型的基础上,提出一种把灰色-Markov模型应用到动态关联规则趋势度挖掘中的方法。该方法利用动态关联规则趋势度定义得到规则的趋势度;对于不满足趋势度阈值的规则的支持度计数序列运用灰色-Markov模型进行预测;将预测数据添加到原规则支持度序列中,并且得到该规则新的趋势度,进而判定此规则的趋势度是否满足阈值要求。通过一个实例进行分析,结果不仅证明了该方法的有效性并且能在一定程度上提高了挖掘的精度和效率,从而使动态关联规则挖掘能够得到更全面、更精确的结果。  相似文献   

14.
针对异构复杂信息网络中存在高维冗余的敏感数据流,可挖掘数据特征形成概率较低,导致需要多次挖掘、挖掘内存占用高、挖掘精度低、时间长的问题,提出基于最大类间散度的网络敏感数据流动态挖掘方法。将敏感数据的差异最大化间隔作为分类基础,得到网络敏感数据的最大类间散度,在遗传迭代状态下确定最优散度迭代函数,对迭代函数进行挖掘特征优选,得出动态可挖掘特征。对可挖掘特征进行聚类分析,挖掘得到数据隐藏信息模式,并对其进行评价,将合理的信息模式进行知识表示,从而实现异构复杂信息网络敏感数据流动态挖掘。实验结果表明,所提方法可挖掘特征形成概率高达98%,labels标记与实际值较为接近。所提方法挖掘精度高,且运行时间较短、内存占用率低。  相似文献   

15.
颜一鸣  郭鑫 《计算机工程》2014,(3):67-70,92
为适应真实环境中数据量大、流程复杂、计算密集的数据挖掘需求,提高传统树增量更新挖掘效率,改变已有算法的串行执行方式,提出一种基于Hadoop的动态树增量更新方法。介绍云计算、模型与执行流程等基本概念,针对现有Hadoop平台中任务调度的随机分配策略,设计一种动态云平台中的资源调度与分配算法,以期达到成本消耗的最小化,给出树增量更新挖掘算法以及2个并行算法(DeleteFreqTree和FindNewTree),完成树数据的增量挖掘工作。实验结果表明,该并行算法有效可行,具有高效性与良好的扩展率,能够对海量树数据进行更新挖掘。  相似文献   

16.
动态数据流具有数据量大、变化快、随机存取代价高、详细数据难以存储等特点,挖掘动态数据流对计算能力与存储能力要求非常高。针对动态数据流的以上特点,设计了一种基于自助抽样的动态数据流贝叶斯分类算法,算法运用滑动窗口模型对动态数据流进行处理分析。该模型以每个窗口的数据为基本单位,对窗口内的数据进行处理分析;算法采用自助抽样技术对待分类数据中的属性进行裁剪和优化,解决了数据属性间的多重线性相关问题;算法结合贝叶斯算法的特点,采用动态增量存储树来解决动态样本数据流的存储问题,实现了无限动态数据流无信息失真的静态有限存储,解决了动态数据流挖掘最大的难题——数据存储;对优化的待分类数据使用all-贝叶斯分类器和k-贝叶斯分类器进行分类,结合数据流的特性对两个分类器进行实时更新。该算法有效克服了贝叶斯分类属性独立性的约束和传统贝叶斯只对静态数据分类的缺点,克服了动态数据流最大的难题——数据存储问题。通过实验测试证明,基于自助抽样的贝叶斯分类具有很高的时效性和精确性。  相似文献   

17.
社会网络中社团核心的发现是目前研究界和产业界关注的热点问题。现有算法把社团处理为特定约束下的图后,将社团核心发现规约为紧凑子图的提取,但对于动态约束下的多图效率很低。为此,提出基于图密度的动态约束社团核心挖掘方法——CCDCD(community core mining with dynamic constrains based on graphdensity)。主要工作包括:(1)分析约束条件变化下,关于社团的图密度变化规律;(2)提出约束变化下,社团图密度的近似求解算法DCUE(dynamic calculation based on updated edges);(3)通过实验表明,与现有方法相比,对较大规模的社团图,新方法能获得更好解,降低时间消耗80%以上;验证了动态约束能发现更多有兴趣度的知识。  相似文献   

18.
Human relationships have led to complex communication networks among different individuals in a society. As the nature of relationship is change, these networks will change over the time too which makes them dynamic networks including several consecutive snapshots. Nowadays, the pervasiveness of electronic communication networks, so called Social Networks, has facilitated obtaining this valuable communication information and highlighted as one of the most interesting researchers in the field of data mining, called social network mining. One of the most challenging issues in the field of social network mining is community detection. It means to detect hidden communities in a social network based on the available information. This study proposes an appropriate solution to find and track communities in a dynamic social network based on the local information. Our approach tries to detect communities by finding initial kernels and maintaining them in the next snapshots. Using well-known datasets, the investigation and comparison of the proposed method with some state-of-the-art approaches indicates that the performance and computation complexity of our method is promising and can outperform its competitors.  相似文献   

19.
河流枯季径流量的实时变化影响着对其预测结果的精确性,为得到准确的预测结果,提高预测效率,提出一种基于SSA-PPR模型的河流枯季径流量变化预测方法。采用SSA-PPR模型构建河流枯季径流量变化预测的大数据统计分析模型,采用量化统计特征分析方法实现对径流量动态变化特征的挖掘,得到变化统计特征量,并结合模糊信息挖掘和自适应学习得到河流枯季径流量变化的动态解析结果。根据解析结果进行流量变化的动态分类识别,完成对河流枯季径流量变化的准确预测。仿真结果表明,本文方法的预测结果准确性较高,自适应性较好,且预测效率较高,有效提高了预测过程的收敛性,对量化分析河流枯季径流量变化具有很好的指导意义。  相似文献   

20.
基于数据挖掘的网络信息安全策略研究   总被引:1,自引:0,他引:1  
随着网络应用越来越普及,网络数据越来越庞大,网络信息安全问题日益严重,面对庞大的互联网数据安全提出了基于数据挖掘的网络信息安全策略,并对网络信息安全数据挖掘方法、挖掘对象、实施过程、挖掘算法进行论述,设计了网络安全分析模型,对静态和动态流量数据进行分析,给出了基于数据挖掘的网络信息安全分析算法的静态网络安全数据分析模型算法和动态流量数据及态势分析算法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号