首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
针对在不平衡的贫困学生数据中,传统的机器算法在分类时会偏向于多数类而忽略少数类,而导致少数特困类的分类准确率低的问题,提出了一种基于代价敏感的贫困生分类方法(CMPSC)。首先采取基于特征选择的预处理方法对低质量的贫困生数据进行处理;然后使用基于遗传算法的搜索方法确定贫困生数据的最优代价敏感矩阵;最后由经预处理的贫困生数据构建兼顾少数贫困类的代价敏感分类器,降低多数贫困类的影响。使用多个真实广西贫困生数据集进行对比实验,以CART算法为基准线,CMPSC方法平均总体分类准确率浮动值为0.66%,平均特困类分类准确率提升率为6.3%,最高提升率可达14.7%。本文方法可以在保持总体分类准确率的同时,有效提高少数特困类的分类准确率。  相似文献   

2.
3.
在数据挖掘领域中,通常以分类精度作为分类算法效果的评估标准。这一标准是建立在假设任意一实例被误分类为任意类时都具备同样代价的基础上的。当此假设不成立时,直接使用传统分类方法就无法取得良好的分类和预测效果。针对这一问题,通过改进编解码方法以及在适应度函数中集成样本的不同误分类代价,提出了一种基于基因表达式程序设计的代价敏感分类算法(CSC-GEP),并在三个UCI数据集上对该算法进行了测试,实验结果表明CSC-GEP是一种有效的代价敏感分类算法。  相似文献   

4.
数据高维且不平衡时,产生的分类器易过度拟合且倾向于牺牲少数类准确率.为降低分类器复杂度且提高少数类识别率,提出了一种代价敏感随机森林算法.以随机森林算法框架为基础,利用Bagging平衡数据,并在基分类器属性分裂度量以及评价函数中引入误分类和测试双重代价,其中测试代价由分裂属性与少数类的相关度决定,使得基决策树在建模过程中向少数类倾斜.与随机森林和仅引入误分类代价的随机森林相比,引入双重代价的随机森林的分类准确率较高,尤其在少数类识别上具有较大优势.  相似文献   

5.
受改变类分布思想的启发,采用最新的最大间隔方法--尺度化凸壳方法来解决代价敏感学习.该方法可以改变样本的分布,且这种改变只需为不同的类赋予不同的尺度因子就可以实现.实验结果表明,尺度化凸壳方法求解代价敏感问题的有效性,其求解过程也非常简单.  相似文献   

6.
提出了一种针对不确定数据的贝叶斯代价敏感分类器算法SBT-CSUNB用来进行单批测试。SBT-CSUNB算法在代价敏感贝叶斯分类器的框架上定义了不确定数据属性对总代价的影响,提出了单批算法的最优属性集合的选择方式。在UCI数据集上的实验表明:SBTCSUNB有效地降低了总代价,并且在不同的参数设定下表现平稳,甚至在高不确定率的情况下算法仍旧表现良好。  相似文献   

7.
基于SVM的多类代价敏感学习及其应用   总被引:1,自引:0,他引:1  
标准的分类器设计一般基于最小化错误率.在入侵检测等问题中,不同类型的错分往往具有不等的代价.通过在支持向量机的类概率输出中引入代价敏感机制,提出了3种基于最小化总体错分代价设计分类器的方法.实验结果表明通过改变代价矩阵,能在漏报率、误报率及稀有类样本的错误率之间调节,从而保证在误报率尽可能小的情况下降低漏报率和稀有类样本的错误率,以减少总体错分代价.  相似文献   

8.
针对网络流量分类中类不均衡问题,提出一种基于K均值和k近邻的流量分类算法(traffic classification based on K-means and k nearest neighbor,KMk NN);以KMk NN为基础设计了一种集成分类器(ensemble classifier based on KMk NN,KKEC)。首先通过抽取不同的输入特征子集分别进行训练,获得不同的分类器,进而采取绝对多数与相对多数相结合的投票方式产生集成输出结果,最后采用非平衡数据集进行测试。理论分析和实验结果都表明,算法在面对非均衡协议流时提高了小类流的识别率。  相似文献   

9.
基于AdaBoost的欠抽样集成学习算法   总被引:1,自引:0,他引:1  
不平衡数据集分类中,采用欠抽样方法容易忽略多数类中部分有用信息,为此提出一种基于AdaBoost的欠抽样集成学习算法U-Ensemble。该方法首先使用AdaBoost算法对数据集预处理,得到各样例权重。训练基分类器时,针对多数类数据不再采用bootstrap抽样方法,而是分别随机选择部分权重较大的样例与部分权重较小的样例,使两部分样例个数与少数类样例个数相同,并组成Bagging成员分类器的训练数据。实验结果证明了算法的有效性。  相似文献   

10.
分布式CAx集成平台是将图形用户界面(GUI)、数据库系统和网络技术综合起来共同为CAx应用软件系统集成服务的通用集成系统,它采用客户/服务器体系结构,中间件技术实现了三层网络结构,重点阐述了该平台的关键技术及集成实例。  相似文献   

11.
针对互联网上数量众多的网站带宽资源长期浪费或突发资源短缺、响应时间长、服务器宕机、网站受到黑客攻击等问题,提出了基于"云"的分布式web安全系统及基于云计算的分布式数据挖掘平台架构,并在此基础上提出了一种新型的分布式数据挖掘模式,利用云计算技术,可以方便地通过网络获取强大的计算能力和存储能力,将消耗大量资源的复杂计算通过网络路由优化和资源约束自适应策略分布到多节点上进行,然后通过组合不同数据站点上的局部数据模型,最终得到全局数据模型。  相似文献   

12.
针对射线检测焊缝图像中缺陷识别正确率低的问题,提出一种选择性集成学习的焊接缺陷识别算法.算法中的个体学习器由稳定分类器和非稳定分类器组成,使用SVM-RFE算法移除集成学习器中的冗余个体学习器,保留子学习器预测输出加权作为集成学习器的输出,有效地增强了个体之间的差异性,进而提高了集成的泛化性能.结果表明:该算法充分利用更多的缺陷特征和样本数据集信息,继承了强集成学习的优点,有效地提高分类正确率.使用一对多的方法把二分类选择性集成学习器推广到多分类问题中,所提出的算法在训练精度为92.4%时;焊缝缺陷识别率提高到85.5%.  相似文献   

13.
基于云计算平台的数据挖掘主要目的是为了更好地处理海量数据,挖掘有用的信息.云计算为海量数据挖掘提供了强大的数据收集、存储和计算能力,简述了云计算技术及其研究现状,详细介绍了基于云计算平台的聚类算法,总结在云计算平台研究聚类所遇到的新问题,对基于云计算平台的聚类发展趋势进行展望.  相似文献   

14.
为了更好地发挥主动学习、半监督学习和集成学习这3种机器学习方法的优势,研究了1个不需要2个充分冗余视图、泛化能力强的高效学习算法。从聚类假设出发,给出每轮协同训练过程中添加自动标记样本的置信度度量方法,降低误标记率;提出作为主动选择未标记样本依据的贡献度的概念,贡献度越高的样本,越具有人工标记的价值,在协同训练迭代结束后,选择贡献度高的样本标记,就能增强反馈的效果,提升学习性能,提出一种基于主动学习的集成协同训练算法。应用于图像检索的实验结果表明,提出的算法是高效可行的。  相似文献   

15.
桉树私有云计算平台的搭建与应用   总被引:1,自引:0,他引:1  
针对企业使用应用软件成本高和维护不便的情况,通过分析私有云计算平台特点,提出了一套基于云终端技术的解决方案.该方案首先利用桉树构建了私有云平台,研究设计了电子点单系统并且制作安装了电子点单软件运行环境的系统镜像,然后将镜像上传到私有云平台中,运行上传的系统镜像,等待系统镜像完全启动后利用基于云终端和触摸屏技术的客户终端通过虚拟桌面协议查看软件运行效果.经过实验表明,客户终端上运行电子点单软件的效果与在个人计算机上运行的效果基本一致,管理维护只需要在私有云平台上进行即可,达到了降低成本和方便维护的目的.  相似文献   

16.
针对云计算环境下数据处理时敏感数据易受非授权访问和非法篡改的问题,提出一种基于可信计算机制的盲数据处理方法。首先利用可信平台模块在云计算环境中建立可信根,确保敏感数据与云计算系统状态相绑定;然后构建盲数据处理环境,通过可信平台模块加密云间传输的信息,进行系统完整性度量和远程验证;最后采用椭圆曲线加密算法完成从源端到目标端的数据迁移。分析结果表明该方法可以为云计算数据处理提供安全的执行环境。  相似文献   

17.
针对目前构建计算机网络攻防实验环境成本过高,对实际网络环境影响较大等问题,使用KVM虚拟机和Openstack虚拟化管理技术,设计了一种基于云计算技术的网络攻防实验平台。实验结果显示,该平台可以虚拟网络环境,有效降低实验成本,实现各种网络攻防实验测试。  相似文献   

18.
针对传统配网不停电作业培训方法存在组织时间长、成本高、规范性差、易受现场条件限制等问题,利用云计算领域的服务器虚拟化、并行编程、分布存储等技术,设计一套分层、易扩展的云平台仿真培训系统架构,建立基于云计算的配网不停电作业仿真培训平台,可实现仿真培训资源的动态调配和教学资源的共享管理。实践表明,该系统通过模拟配网现场作业环境和操作流程,能直观形象地展现配网不停电作业的操作技巧与易错难点,为配网运维检修技能训练提供了一种新型有效的培训手段。  相似文献   

19.
针对云计算环境下被监测对象的异构性、动态性和复杂多样性等问题,提出一个云计算环境下的资源监控平台,该平台包括用户接口,数所分析与资源优化调度,监控管理,监控内核和底层工具五部分。介绍了每层的详细功能,讨论了基于事件和规则的监控方法和松耦合的云计算监控组件的设计思想,重点阐述了平台的主要技术实现。该平台利用监控和预警机制保障云计算平台的可用性,具有重要的应用价值。  相似文献   

20.
针对云环境下大量并行计算易导致节点负载不均影响云平台服务质量的问题,提出一种基于云环境的弹性负载均衡方案。该方案构造了负载均衡模型框架,对虚拟机负载状况和虚拟机集群资源利用率进行量化评估,并为实现虚拟机集群负载的均衡和弹性伸缩,设计了负载均衡模型和弹性伸缩算法。测试结果表明在该负载均衡机制下,新方案的用户响应时间有所改善,可相应提高资源利用率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号