首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
针对MLKNN算法仅对独立标签进行处理,忽略现实世界中标签之间相关性这一问题,提出了一种基于关联规则的MLKNN多标签分类算法(FP-MLKNN)。该算法采用关联规则算法挖掘标签之间的高阶相关性,并用标签之间的关联规则改进MLKNN算法,以达到提升分类性能的目的。首先,使用MLKNN算法求样本的特征置信度;采用关联规则算法挖掘生成一系列强关联规则,进而将2种算法进行融合来构造多标签分类器,对新标签进行预测;在此基础上,将本文提出的算法与MLKNN、AdaBoostMH和BPMLL这3种算法进行实验对比。实验结果表明,本文所提算法在yeast、emotions和enron数据集上的分类性能均优于这3种算法,具有较好的分类效果。  相似文献   

2.
为了更好地界定本体中的概念,提出一种基于遗传算法(Genetic Algorithm,GA)的本体概念分类规则的学习方法.从已有的本体库中获取实例作为训练样本,通过该算法寻找一组与数据样本集一致的规则.以一组规则集作为遗传算法的个体,即优化的目标,同时考虑到规则集的覆盖性、一致性、简洁性和多样性4个方面建立适应值函数,优化得到一组能够分类概念的规则集合.进而这组规则集可用于指导和丰富本体知识,例如当本体中引入新的实例时,可以通过此概念分类规则集确定实例所属的概念.对已有本体学习后的实验结果表明该算法收敛性很好,而且能获得较好的规则集.  相似文献   

3.
针对本体学习中的概念学习,提出了一种基于改进遗传算法的本体概念规则的学习方法。该方法在传统遗传算法的遗传操作算予中引入“杂交优势”思想对交叉算子进行了改进,并加强了变异算子的对算法的影响;同时算法在执行过程中对训练样本集使用了约减策略,从而找出了一个能正确覆盖样本空间中所有实例并且不覆盖任何错误实例的规则集合。  相似文献   

4.
Ant colony optimization (ACO) algorithms have been successfully applied in data classification, which aim at discovering a list of classification rules. However, due to the essentially random search in ACO algorithms, the lists of classification rules constructed by ACO-based classification algorithms are not fixed and may be distinctly different even using the same training set. Those differences are generally ignored and some beneficial information cannot be dug from the different data sets, which may lower the predictive accuracy. To overcome this shortcoming, this paper proposes a novel classification rule discovery algorithm based on ACO, named AntMinermbc, in which a new model of multiple rule sets is presented to produce multiple lists of rules. Multiple base classifiers are built in AntMinermbc, and each base classifier is expected to remedy the weakness of other base classifiers, which can improve the predictive accuracy by exploiting the useful information from various base classifiers. A new heuristic function for ACO is also designed in our algorithm, which considers both of the correlation and coverage for the purpose to avoid deceptive high accuracy. The performance of our algorithm is studied experimentally on 19 publicly available data sets and further compared to several state-of-the-art classification approaches. The experimental results show that the predictive accuracy obtained by our algorithm is statistically higher than that of the compared targets.  相似文献   

5.
针对构建FP-Tree时存在的大量内存消耗问题,提出了CCFP(constraint clip FP-tree)算法,该算法利用有项和缺项约束对事务数据库进行修剪后构造简化的FP-Tree,经再一次扫描后得到关联规则.实验结果表明:该算法较一般的FP-Tree算法能节省大量的内存空间,同时,运行效率也略有提高.  相似文献   

6.
提出了一种基于关联规则的多类标算法(MLAC).利用多类标FP-tree来分解组合生成多类标规则.并通过组合多重关联规则分类器进行分类预测,降低了由高维属性带来的高计算复杂度,有效地提高了算法的性能和效率.针对多类标数据集的实验结果表明,MLAC算法在性能和效率等方面均优干ML-KNN等多类标分类算法.  相似文献   

7.
基于关联规则的文本聚类算法的研究   总被引:1,自引:0,他引:1  
K-均值聚类算法是目前一种较好的文本分类算法,算法中的相似度计算通常基于词频统计,小文档或简单句子由于词频过小,使用该算法聚类效果较差。为此,提出了一种基于词语关联度的相似度计算算法,对简单文档集执行关联规则算法,得出基于关键词的关联规则,并根据这些规则求得词语关联度矩阵,然后由权重对文本进行文本特征向量表示,最后借助于关联度矩阵和文本特征向量,并按一定算法计算出句子相似度。实验证明该算法可得到较好的聚类结果,且其不仅利用词频统计的方法而且考虑了词语间的关系。  相似文献   

8.
夏英  刘婉蓉 《计算机应用》2008,28(12):3224-3226
现有的关联规则算法大多都致力于解决增量式更新问题,需要多次扫描数据集,无法对海量数据进行有效处理。针对此问题,提出了基于滑动窗口的关联规则增量式更新算法(SWIUA),利用滑动窗口进行数据更新,挖掘出用户感兴趣的关联规则。该算法只需要扫描原始数据集和更新的数据各一遍,降低了I/O时间;并采用优化策略对候选项集过滤和删除,提高了关联规则的挖掘性能,能有效处理大量新增数据。  相似文献   

9.
稀疏表示和贪婪搜索的人脸分类   总被引:2,自引:1,他引:2       下载免费PDF全文
目的 随着稀疏表示方法在图像重建问题中的巨大成功,研究人员提出了一种特殊的分类方法,即基于稀疏表示的分类方法.为了加强样本间的协作表示能力以及减弱稀疏分解时的强L1约束,提出了一种在稀疏分类框架下的迭代剔除机制和贪婪搜索策略的人脸识别方法.方法 将测试样本表示成训练样本线性组合的方式,并在所有训练样本中通过迭代计算来消除对分类影响较小的类别和单个样本,在系数分解的过程中采用最小误差正交匹配追踪(EcOMP)算法,进而选择出贡献程度大的类别样本并进行分类.结果 在迭代更新样本字典的过程中,强化了真实类别的表示能力,并弱化了分解系数的强L1约束.在所有的实验中,正则化参数λ的取值为0.001,在ORL、FERET和AR 3个人脸数据库上,本文算法的识别率可分别达到97.88%、67.95%和94.50%,进而验证了本文算法的有效性.结论 提出的在稀疏分类框架下的迭代剔除机制和贪婪搜索策略的人脸识别方法,在动态迭代的机制中完成了样本字典的更新,平衡了协作表示和稀疏约束的关系,相比较原始的稀疏分类模型有更好的准确性和稳定性.  相似文献   

10.
马腾  陈庶樵  张校辉  田乐 《计算机应用》2013,33(9):2450-2454
为克服决策树算法处理高速网络、大容量规则集下的报文分类问题时内存使用量大的弊端,提出一种基于规则集划分的多决策树报文分类算法。在保证规则子集数量可控的前提下,采用启发式算法将规则集划分为有限个规则子集,最大限度分离交叠规则;提出两级级联决策树结构,降低决策树深度以减少规则查找时间。理论分析表明,该算法空间复杂度较传统单决策树算法大幅降低。仿真结果表明,该算法的内存使用量比目前空间性能最好的EffiCuts算法减少了30%,且维度可扩展性更好。  相似文献   

11.
崔建  李强  刘勇 《计算机应用》2011,31(5):1348-1350
为提高数据库分类系统的分类精度,提出一种新的分类方法。首先,利用模糊C-均值聚类算法对数据库中的连续属性进行离散化;然后,在此基础上提出一种改进的模糊关联算法挖掘分类关联规则;最后,通过计算规则和模式之间的兼容性指标来构造特征向量,构建支持向量机的分类器模型。实验结果表明,该方法具有较高的分类识别能力和分类效率。  相似文献   

12.
在提取满足用户特定需求的关联规则时,由于现有约束性关联规则挖掘算法存在大量的冗余候选项和重复计算,故提出一种基于属性位复用的约束性关联规则挖掘算法,其适合挖掘任何长度且满足用户特定需求的关联规则。该算法通过属性位的权值组合,将交易事务转换成整数,用属性位复用技术构建候选区间,并利用其端点值双向变化,构建索引候选频繁项,同时也用布尔运算计算其支持数。实验证明其比现有算法更快速,将其应用到客户关系管理系统中分析客户关联信息,可以有效地提高系统效率。  相似文献   

13.
为发现精准的关联规则,对多层关联规则问题进行研究,提出基于散列技术的Hash_Cumulate多层关联规则算法.通过对原有Cumulate算法进行分析,对Cumulate算法有较多冗余候选集影响算法运行时间的缺点进行改进,提出在产生候选2项集时判断其中两项的关系进行删减,将候选2项集映射到散列表中进行筛选,减少候选集数量,进而减少扫描事务集的时间,提高算法运行效率.通过对原Cumulate算法与Hash_Cumulate算法进行实验比较和实例分析,验证Hash_Cumulate算法具有较高的运行效率.  相似文献   

14.
针对安全审计系统中存在的智能程度低、日志信息没有充分利用的问题,提出一个基于关联规则挖掘的安全审计系统。该系统充分利用已有审计日志,结合数据挖掘技术,建立用户及系统的行为模式数据库,做到及时发现异常情况,提高了计算机的安全性。在传统Apriori算法的基础上提出一种改进的E-Apriori算法,该算法可以缩小待扫描事务集合的范围,降低算法的时间复杂度,提高运行效率。实验结果表明基于关联规则挖掘的审计系统对攻击类型的识别能力提升在10%以上,改进的E-Apriori算法相比经典Apriori算法和FP-GROWTH算法在性能上得到了提高,特别是在大型稀疏数据集中最高达到51%。  相似文献   

15.
基于启发式的隐私保护关联规则挖掘算法常通过删除项或增加项改变规则的支持度,现有的通过删除项的隐私保护关联规则挖掘算法设计过程中通常忽略了兴趣度和规则的左件,导致对非敏感规则的支持度和数据可用性影响很大。针对上述不足,在算法设计过程中引入了兴趣度和逐步移项的思想,通过对敏感规则的左右件选择性地适当处理,不仅成功隐藏了指定隐私规则集,同时降低了对非敏感规则支持度的影响,提高了数据的可用性。理论和实验结果表明i,f-then算法具有较好的隐私性和高效性。  相似文献   

16.
为发现精准的关联规则,对多层关联规则问题进行研究,提出基于散列技术的Hash_Cumulate多层关联规则算法.通过对原有Cumulate算法进行分析,对Cumulate算法有较多冗余候选集影响算法运行时间的缺点进行改进,提出在产生候选2项集时判断其中两项的关系进行删减,将候选2项集映射到散列表中进行筛选,减少候选集数量,进而减少扫描事务集的时间,提高算法运行效率.通过对原Cumulate算法与Hash_Cumulate算法进行实验比较和实例分析,验证Hash_Cumulate算法具有较高的运行效率.  相似文献   

17.
提出了基于属性重要性的关联分类方法.与传统算法不同的是根据属性重要性程度生成类别关联规则;并且在构造分类器时改进了CBA算法中对于具有相同支持度、置信度规则选择时的随机性.实验结果证明,用该方法得到的分类规则与传统的关联分类算法相比,复杂度低,且有效提高了分类效果.  相似文献   

18.
针对医学图像数据的特殊性,提出了一种适合挖掘大量医学图像数据的关联分类算法.该算法以频繁模式树为基础,通过引入双支持度,排除一部分对分类无意义且存在干扰的项,以提高分类正确率.实验结果表明,当用于医学图像分类时,该算法可以取得同样的基于关联规则的分类算法CMAR更高的执行效率及更好的分类效果.  相似文献   

19.
针对有向无环图描述的截止期约束下的网格工作流费用优化问题,提出了基于贪心策略的网格工作流费用优化算法GSA-GW(greedy scheduling algorithm for grid workflow)和IGSA-GW(improved GSA-GW)。算法首先在当前分配下将截止期转换为各任务的全局时间浮差,各任务再在全局时间浮差的限制下按照两种贪心策略选择备选资源替换原有分配。实验结果证明,两算法能较好地优化工作流费用,提高工作流调度效率。  相似文献   

20.
提出一种快速算法,该算法利用贪心算法构造卷数据降维矩阵,在保持点与点之间“核距离”不变的情况下.把待分解矩阵变换成一个低维矩阵。在没有偏差的情况下,将对原始大矩阵的分解变成对这个低维矩阵的分解,大幅降低了时间复杂度,减少了对内存的使用率的同时增加了算法的稳定性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号