首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 218 毫秒
1.
关联规则挖掘算法中常用的支持度和可信度是对关联规则在统计意义上的有效性度量,在挖掘结果的有用度上缺乏指导作用,它们不能作为有用性的指标.从数据挖掘的最终目的出发定义了基于最终用户实际目标的效益度指标,并对最小效益度筛选性质进行了论证,提出了一种快速有效的关联规则挖掘算法.讨论了从关联规则的兴趣模板和限制模板转换到效益度的方法.实验结果表明,效益度指标具有支持度与可信度不可替代的作用;该算法的最小效益度剪切技术是有效的,不仅可以较大幅度地提高算法速度,而且可以作为规则模板的统一实现算法以及提供更精确的控制.  相似文献   

2.
针对已有的对低支持度关联规则进行挖掘的算法中没有提出对具有多个相关项的关联规则进行挖掘的有效方法,本文提出一种能够对低支持度关联规则的多个相关项进行有效挖掘的方法。算法基于相似度来衡量各个相关项的关联程度,在已有算法的基础上增加了一次特殊的矩阵转换,从而将对项的相似度衡量方法进行了转换,转换后的矩阵可以基于Apriori性质来拓展多个相似相关项。算法在低支持度情况下具有较高的挖掘效率和良好的挖掘效果,算法还可以用来挖掘多个项之间的排斥规则。  相似文献   

3.
以前基于支持度一置信度框架的关联规则挖掘算法都是先用支持度做为阈值对搜索结果进行剪枝,产生频繁集,再针对频繁集产生关联规则,这就是频繁关联规则,然而在很多应用,诸如:鉴别相似的Web文件,网络中入侵检测等,有许多有趣的关联规则仅有很少的支持度,在本文中,针对这种情况,提出了一种可以挖掘非频繁项之间有趣规则的算法,此算法先用相似度作为兴趣度度量以算法结果进行剪枝。  相似文献   

4.
关联规则挖掘是数据挖掘的重要领域之一,目前多数监督学习算法对满足最小支持度和最小置信度的关联规则进行深入分析的较少。剖析了分类关联规则挖掘算法CAR-Apriori算法,并提出了一种基于多最小支持度和支持度差别限制的分类关联规则挖掘算法MSCAR-Apriori算法。实验结果表明,改进算法不仅可以挖掘出满足给定条件的分类关联规则,同时还可以保留稀有但用户感兴趣且可能蕴涵巨大利润的规则项。  相似文献   

5.
以前基于支持度一置信度框架的关联规则挖掘算法都是先用支持度做为阈值对搜索结果进行剪枝 ,产生频繁集 ,再针对频繁集产生关联规则 ,这就是频繁关联规则。然而在很多应用中 ,诸如 :鉴别相似的Web文件、网络中入侵检测等 ,有许多有趣的关联规则仅有很少的支持度。在本文中 ,针对这种情况 ,提出了一种可以挖掘非频繁项之间有趣规则的算法 ,此算法先用相似度作为兴趣度度量对算法结果进行剪枝  相似文献   

6.
针对负关联规则挖掘所带来的问题,提出加入最大支持度来控制频繁项集生成规模,改进了相关性的计算公式,并将其用作正负关联规则的兴趣度来剔除无兴趣的关联规则,限制关联规则中的前后件项目个数来保证挖掘出的关联规则的实用性和可理解性。最后,给出一种能够同时挖掘正负关联规则的算法,实验结果表明算法是有效的、可行的。  相似文献   

7.
针对负关联规则挖掘所带来的问题,提出加入最大支持度来控制频繁项集生成规模,改进了相关性的计算公式,并将其用作正负关联规则的兴趣度来剔除无兴趣的关联规则,限制关联规则中的前后件项目个数来保证挖掘出的关联规则的实用性和可理解性.最后,给出一种能够同时挖掘正负关联规则的算法,实验结果表明算法是有效的、可行的.  相似文献   

8.
一种多重最小支持度关联规则挖掘算法   总被引:5,自引:0,他引:5  
针对单一最小支持度挖掘关联规则不能反应不同数据项出现频度与性质的问题,提出了一个基于频繁模式树的多重支持度关联规则挖掘算法MSDMFIA(Multiple minimum Supports for Discover Maximum Fre-quent Item sets Algorithm),根据不同数据项的特点定义多重支持度,通过挖掘数据库中的最大频繁项目集,计算最大频繁候选项目集在数据库中的支持度来发现关联规则.该算法可以解决关联规则挖掘中经常出现的稀少数据项问题,并解决了传统的关联规则挖掘算法中的生成频繁候选集和多次扫描数据库的性能瓶颈.实验结果表明,本文提出的算法在功能和性能方面均优于已有算法.  相似文献   

9.
基于集体度-置信度的关联规则挖掘   总被引:2,自引:0,他引:2  
总结并研究了基于集体度-置信度的关联规则挖掘算法,用集体度代替支持度对搜索空间进行压缩,成功地解决了传统的频繁关联规则挖掘存在的属性集产生上的欺骗性及处理稠密数据集方面的缺陷.  相似文献   

10.
一种改进的关联规则挖掘算法   总被引:2,自引:0,他引:2  
本文在Aprioi算法的基础上,引入了临时数据库及多支持度,使交易数据库的规模不断缩小,同时又灵活控制了各频繁项集产生的数量,结果表明该算法对关联规则挖掘较为有效。  相似文献   

11.
随着信息技术的快速发展和服务计算的广泛应用,有效的过程管理支持随需应变的软件服务变得愈发重要。现代软件服务工程面临诸多挑战,如微服务架构与服务拆分、多团队沟通协作等。为此,结合基于敏捷统一过程(ARUP)的演进式服务开发方法,提出了一种基于开发运维一体化(DevOps)的团队协同和能力成熟度模型集成(CMMI)的过程管理优化策略与算法,案例分析展示需求管理和质量保障是软件开发持续过程改进的最有效方法,所提出的算法有效提高软件服务的质量、效率和可持续性,可为学术研究者和工业实践者提供参考与指导。  相似文献   

12.
生物RNA二级结构预测是生物信息学领域的一个重要研究问题.近来,研究人员提出应用元启发式算法来预测RNA二级结构.该文提出基于禁忌遗传算法的RNA二级结构预测方法(TGARNA),给出茎区相容性检测改进方法,保留最长茎区构造茎区相容个体,以改善种群性能;同时将禁忌搜索融入遗传操作以防止近亲繁殖,保持种群多样性.仿真实验...  相似文献   

13.
一种改进的AprioriTid算法   总被引:1,自引:0,他引:1  
针对经典Apriori算法多次扫描数据库产生I/O负载影响运行效率等问题,在对Apriori算法的原理及其相关改进算法研究的基础上,提出了一种基于压缩集的改进Apriori算法,即Apriori Tid_M算法.通过有效的裁剪方法减少无效项集的产生,减少候选项集的数量,从而提高算法的效率.仿真实验表明,在支持度相同但数据量不同,以及数据量相同但支持度不同这两种条件下,Apriori Tid_M算法在性能上和运算时间上都比Apriori算法有很大程度的改善.  相似文献   

14.

对于平衡数据集支持向量机(support vector machine,SVM)通常具有很好的分类性能和泛化能力,然而对于不平衡数据集,SVM只能得到次优结果,针对该问题提出了一种基于SVM的AS-AdaBoostSVM分类算法. 首先,通过使用ADASYN采样,提高少类样本在边界区域的密度;然后,使用基于径向基核支持向量机(radial basis function kernel mapping support vector machine,RBFSVM)模型弱分类器的AdaBoostSVM算法训练得到决策分类器. 通过将该算法在各种不平衡数据集上的测试结果与单纯运用ADASYN技术、AdaBoostSVM、SMOTEBoost等其他分类器进行比较,验证了该算法的有效性和鲁棒性.

  相似文献   

15.
谱聚类是近年来一类具有较好应用前景的聚类方法。本文将独立成分分析引入到传统的谱聚类方法中,提出了一种基于独立成分分析的谱聚类算法。利用独立成分析作为预处理,消除了数据内的冗余信息,使得待聚类数据点在高阶统计量的意义下相互独立。文中对比实验证明了该方法的有效性。  相似文献   

16.
基于支持向量机的短期负荷预测的方法改进   总被引:2,自引:0,他引:2  
在对支持向量机(Support Vector Machines,SVM)方法的参数性能进行分析的基础上,提出了将Grid-search方法引入至基于支持向量机的短期负荷预测算法中,以解决支持向量机方法的参数选择问题。该参数选择方法减少了参数选择的盲目性,提高了SVM的预测精度。通过在East-Slovakia Power Distribution Company提供的电网运行数据上验算,证明了该改进方法的正确性和有效性。  相似文献   

17.
对于平衡数据集支持向量机(support vector machine,SVM)通常具有很好的分类性能和泛化能力,然而对于不平衡数据集,SVM只能得到次优结果,针对该问题提出了一种基于SVM的AS-Ada Boost SVM分类算法.首先,通过使用ADASYN采样,提高少类样本在边界区域的密度;然后,使用基于径向基核支持向量机(radial basis function kernel mapping support vector machine,RBFSVM)模型弱分类器的Ada Boost SVM算法训练得到决策分类器.通过将该算法在各种不平衡数据集上的测试结果与单纯运用ADASYN技术、Ada Boost SVM、SMOTEBoost等其他分类器进行比较,验证了该算法的有效性和鲁棒性.  相似文献   

18.
改进的离散PSO和SVM的特征基因选择算法   总被引:2,自引:0,他引:2  
针对现有的基于粒子群的特征基因选择算法易于陷入局部最优的问题,提出了一种改进的离散粒子群和支持向量机的特征基因选择算法IDPSO-SVM.该算法首先预选一些与分类强相关的基因组成特征基因备选集合,然后基于此集合采用PSO进行寻优搜索,并应用SVM对选出的特征子集的分类能力进行评估,最后得出最优特征子集.该算法加入了一种可以有效克服粒子群在寻优过程中陷入局部最优的机制,因而可以不断探测到新的最优解.该算法在结肠癌与前列腺癌数据集上的分类精度分别达到了96.8%与99.0%,从而证明了其有效性与可行性.  相似文献   

19.
为解决Spark任务运行过程中的性能评估与改进问题,本文提出一种基于启发式算法和支持向量机回归模型的Spark性能评价与分析方法.本文首先提出一种启发式性能评价算法,该方法采用Ganglia收集并处理Spark任务运行时的集群资源消耗数据,根据k-means算法划分任务类型,并根据任务类型确定启发式性能评价算法的评价指标和初始权重.然后,从Spark历史服务器中收集并处理任务运行效率数据,与集群资源消耗数据一并作为Spark任务运行时的状态数据.最后,根据状态数据迭代确定启发式性能评价算法的最终权重,以此建立Spark性能评价回归模型.本文随后提出一种基于支持向量机SVM回归算法(SVR)的Spark性能分析方法.该方法对Spark配置参数与整体性能建立回归模型,然后对该回归模型进行敏感度分析,找到能够影响Spark性能的重要参数.实验结果表明,启发式性能评价算法能够量化Spark任务资源消耗和运行效率等各方面性能,比较全面地评估任务的整体性能.基于SVR的性能分析方法能够比较有效地应用于Spark任务的实际分析中,形成初步的Spark任务性能调优建议.  相似文献   

20.
在现有约束传播算法研究的基础上,提出了一种基于比特位操作的自适应约束传播算法AC_MaxRPC_Bitwise。该算法在寻找AC支持及PC支持中引入基于比特位的数据结构,并利用比特位操作加速AC支持和PC证据搜索,从而提高自适应约束传播的效率。对几类典型benchmark问题的测试结果表明,算法AC_MaxRPC_Bitwise在总体性能上明显优于AC及原自适应约束传播算法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号