首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 171 毫秒
1.
由于专家能够对土地资源标定类别的数量是非常有限的,提出利用少量已知类别的训练样本抽取其中的关联规则作为监督信息,结合非监督方法中的变色龙算法,以互连性和相似度作为评价标准进行分类的方法。该算法充分利用监督学习分类准确率高和非监督学习无需标定学习样本的优点,只需利用少量带标签的学习样本,即可得到较高的分类准确率。通过对广东省土地资源的评价实验,表明仅随机选取300组训练样本即可得到较高的土地评价准确率94.418 4%,比同样条件下聚类分析的准确率高4.904 1%。  相似文献   

2.
关联分类通常产生大量的分类规则,导致在分类新实例时经常产生规则冲突问题。针对这种规则冲突问题,提出了一种基于改进关联分类的两次学习框架。利用频繁且互关联的项集产生分类规则改进关联分类算法,有效减少了规则数。应用改进的关联分类算法产生的一级规则一次性分离出训练集中规则冲突的所有实例。然后,在冲突实例上应用改进的关联分类算法进行第二次学习得到二级规则。分类新实例时,首先利用第一级规则进行分类。如果出现规则冲突,则利用第二级规则分类该实例。实验结果表明,基于改进关联分类的两次学习方法降低了规则冲突比率,并且显著提高了分类准确率。  相似文献   

3.
关联规则挖掘算法在分类中的应用研究   总被引:1,自引:0,他引:1  
提出了一个基于关联规则挖掘算法的医疗数据分类方法。介绍了关联规则的理论基础、关联规则挖掘算法及其在医疗数据挖掘中的应用方法,并利用介绍的算法对乳腺癌数据进行挖掘。获得了分类的实验结果,该模型系统达到了较高的分类准确率,证明了数据挖掘在辅助医疗诊断中有着广泛的应用前景。  相似文献   

4.
实时数据流中标记样本所占比例较小,并且存在大量的噪声数据和冗余数据,导致数据流的实时分类准确率较低。针对这种情况,提出基于拉普拉斯回归主动学习的大数据流分类算法。为分类器设计相对支持度差异函数作为分类的决策方法,通过阈值判断当前数据流的标记样本量。设计基于约束规则的半监督主动学习算法,从无标记样本集选择信息量最丰富的样本。采用拉普拉斯正则最小二乘回归模型作为半监督学习的回归模型,迭代地扩展数据流的标记样本量。仿真结果表明,该算法有效地提高了数据流的分类准确率,并且满足实时性的需求。  相似文献   

5.
针对现有关联分类算法资源消耗大、规则剪枝难、分类模型复杂的缺陷,提出了一种基于分类修剪的关联分类算法改进方案ACCP.根据分类属性值的不同对分类规则前项进行分块挖掘,并对频繁项集挖掘过程和规则修剪进行了改进,有效提高了分类准确率和算法运行效率.实验结果表明,此算法改进方案相比传统CBA算法和C4.5决策树算法有着更高的分类准确率,取得了较好的应用效果.  相似文献   

6.
一种基于多目标进化算法的模糊关联分类方法   总被引:1,自引:0,他引:1  
准确率和解释性是模糊关联分类模型的两个相互制约的优化目标.目前已有的研究方法中,有的只考虑了分类模型的准确率,有的把模型两个目标转化为单目标问题求解,在模型解释性目标上的优化策略较简单.为此提出一种基于Apriori和NSGA-II多目标进化算法的模糊关联分类模型(MOEA-FACM),采用基于概率独立性的模糊确认指标筛选生成高质量的模糊关联规则集,以Pittsburgh式的编码方式构建准确率和解释性折中的模糊关联分类模型.标准数据集上的实验表明,该方法所建模型分类准确率比同类模型高,分类模型具有较好的泛化能力,而其所含模糊关联规则的数目和规则前件总的模糊项的个数却较少,模型的解释性较好.  相似文献   

7.
在入侵检测方法中,半监督学习作为一种特殊的学习形式,结合了监督学习与非监督学习在检测已知模式数据与未知模式数据方面各自的优点.据此,为进一步提高入侵检测系统的检测准确性,提出一种结合SVM与KMO(online kmeans)算法各自优点的半监督入侵检测模型.该模型首先利用SVM算法对全部的输入数据进行区分,然后将其认为的合法数据集用KMO算法分类,以该结果作为决策模块的输入并做出最终的响应.实验显示,文中模型比单独使用其中的任一种方法具有更高的检测准确率.由此可见,该模型对于实际的入侵检测系统具有实用价值.  相似文献   

8.
医学图像的关联规则挖掘方法研究   总被引:8,自引:0,他引:8  
提出了一个基于关联规则挖掘算法的医学图像分析器。介绍了数量型属性离散化的CA算法、关联规则挖掘算法及其在医学图像数据挖掘中的应用方法,并利用介绍的算法对乳腺癌图像数据进行挖掘。实验结果表明,该模型系统达到了较高的分类准确率。  相似文献   

9.
基于信息增益的中文文本关联分类   总被引:1,自引:0,他引:1  
关联分类是一种通过挖掘训练集中的关联规则,并利用这些规则预测新数据类属性的分类技术。最近的研究表明,关联分类取得了比传统的分类方法如C4.5更高的准确率。现有的基于支持度-置信度架构的关联分类方法仅仅是选择频繁文字构建分类规则,忽略了文字的分类有效性。本文提出一种新的ACIG算法,结合信息增益与FoilGain在中文文本中选择规则的文字,以提高文字的分类有效性。实验结果表明,ACIG算法比其他关联分类算法(CPAR)有更高的准确率。  相似文献   

10.
甘昕艳  唐晓年 《计算机仿真》2021,38(3):282-285,326
传统的挖掘模型未能有效提取时序数据的特征,导致计算开销较大,挖掘准确率以及效率偏低.为此,研究结合卷积神经网络设计并组建一种新的时序数据关联规则挖掘模型.通过连续模板匹配技术分析时序数据的分布式数据结构,然后结合匹配相关检测技术对时序数据展开融合处理,通过频繁项检测提取其中的关联规则特征.对提取的关联规则通过CNN分类器进行属性划分,结合特征压缩方法对分类输出的时序数据进行降维处理,再利用模糊聚类算法构建时序数据关联规则挖掘模型.仿真结果表明:模型能够有效降低挖掘过程的计算开销,并提升了挖掘结果的准确率以及挖掘效率.  相似文献   

11.
On the basis of the Apriori algorithm, a class association rule algorithm is presented. A sea–land separation method was designed, and then a shoreline detection method proposed for interpreting multispectral remote sensing images. When separating the land from the sea, not only the spectral attributes but also the texture attributes and basic statistical values were considered in attribute space. To test the feasibility of the method, a Landsat Enhanced Thematic Mapper Plus (ETM+) image scene was used to interpret the coastline. First, the association rules of the sea–land separation of the study area were discovered from learning samples by using the class association rule algorithm. Second, the sea and the land of the image were separated with the mined rules. Third, the coastline was interpreted from the separation result. The accuracy of the interpretation result was computed with a proposed line matching accuracy evaluation algorithm. We show that the proposed method can interpret the coastline accurately and does not require any complex preprocessing.  相似文献   

12.
基于光谱相似尺度的支持向量机遥感土地利用分类   总被引:2,自引:0,他引:2       下载免费PDF全文
提出一种基于光谱相似尺度( spectral similarity scale, SSS ) 的支持向量机( support vector machines, SVM) 遥感土地分类新方法, 该方法选择莆田市作为遥感土地利用分类典型研究区, 利用该区域的Landsat7 ETM 遥感影像结合地面实况调查数据, 从图像上选取少量具有代表性的样本点的光谱作为参考光谱, 利用SSS 方法提取训练样本, 然后应用SVM 算法进行遥感土地利用分类, 并将分类结果与最大似然分类算法( MLC) 相比较, 实验结果表明分类精度上有了很大的提高。  相似文献   

13.
为解决分类器学习新样本知识的问题,提出一种基于近邻算法的增量学习算法。该算法以最近邻算法为基础,首先计算新样本与标准样本之间的匹配度,找到最佳匹配样本和次佳匹配样本,然后通过与匹配度阈值进行比较来决定是类内学习还是类别学习。算法采用UCI中的标准数据集进行实验并应用于车辆识别仿真,其结果验证了该算法的有效性。实验进一步研究了匹配度阈值的选择和初始化样本数量选取对分类正确率影响。  相似文献   

14.
基于深度学习模型的有监督训练依赖于大量高质量标定数据,但众多小众计算机博弈比赛棋种,存在缺少人类对局记录作为训练样本的问题,因此在使用深度学习模型前如何生成一个合理标定的局面数据集是值得研究探讨的问题。针对点格棋博弈问题,提出了一种数据哈希去重以及局面标定方法。根据不同阶段回合局面数据的特点,通过alpha-beta完全搜索、回溯标定、并行化MCTS算法标定以及对称扩展技巧,收集并标定不同回合数的点格棋局面样本。实验共获得了包含15 000 000个带标定点格棋局面样本的数据集,为基于深度学习模型的点格棋有监督训练提供了保障。此外,所提方法也为其他棋种训练数据的获取提供有价值的借鉴。  相似文献   

15.
多数分类识别算法需要大量的已标注样本对分类模型进行训练。实际应用中,对大量样本进行标注枯燥耗时且代价昂贵,因此能够获得的已标注样本数量非常有限。将基于不确定性样本的主动学习和代表性样本的自学习方法引入到基于支持向量数据描述的分类模型中,提出了一种新的分类识别方法。通过主动学习去挖掘那些对当前分类模型最有价值的样本进行人工标注,并借助自学习方法进一步利用样本集中大量的未标注样本,使得在花费较小的标注代价下,能够获得良好的分类性能。在潜艇机械噪声源识别问题上的实验结果验证了该方法能有效降低样本标注代价。  相似文献   

16.
针对脑肿瘤磁共振成像(MRI)勾画数据少、类别不平衡以及各个私有的数据库具有较大差异导致脑肿瘤MRI图像分割困难的问题,提出了一种基于局部—全局自适应信息学习(ALGIL)分割算法.该方法只需要少量的勾画数据,解决了传统监督学习中对勾画数据数量的依赖问题.通过融合图像的空间域信息和频域信息,利用小波变换将图像从空间域转...  相似文献   

17.
计算机棋类游戏学习中的自对弈学习指仅依赖行棋过程及最终的输赢结果的学习.整个过程中除下棋规则外不预设任何领域知识,也无专家指导.虽然基于极大极小算法、α-β剪枝算法和蒙特卡洛搜索的自对弈学习已经取得了卓越成果,但是目前仍旧缺乏对于学习样例质量评价的针对性研究.因此,本文首次提出了一种自对弈棋局学习样例质量评价方法,该方法采用样本规模综合指标T—使用样例重复度和样例个数的线性组合—来决定学习样例大小.在西洋跳棋上的实验表明,本评价方法可以达到有效控制学习样例规模的目的,在不降低学习效果的前提下大幅降低学习样例产生的计算成本.  相似文献   

18.
半监督学习方法通过少量标记数据和大量未标记数据来提升学习性能.Tri-training是一种经典的基于分歧的半监督学习方法,但在学习过程中可能产生标记噪声问题.为了减少Tri-training中的标记噪声对未标记数据的预测偏差,学习到更好的半监督分类模型,用交叉熵代替错误率以更好地反映模型预估结果和真实分布之间的差距,并结合凸优化方法来达到降低标记噪声的目的,保证模型效果.在此基础上,分别提出了一种基于交叉熵的Tri-training算法、一个安全的Tri-training算法,以及一种基于交叉熵的安全Tri-training算法.在UCI(University of California Irvine)机器学习库等基准数据集上验证了所提方法的有效性,并利用显著性检验从统计学的角度进一步验证了方法的性能.实验结果表明,提出的半监督学习方法在分类性能方面优于传统的Tri-training算法,其中基于交叉熵的安全Tri-training算法拥有更高的分类性能和泛化能力.  相似文献   

19.
Recently, methods based on Artificial Intelligence (AI) have been widely used to improve positioning accuracy for land vehicle navigation by integrating the Global Positioning System (GPS) with the Strapdown Inertial Navigation System (SINS). In this paper, we propose the ensemble learning algorithm instead of traditional single neural network to overcome the limitations of complex and dynamic data cased by vehicle irregular movement. The ensemble learning algorithm (LSBoost or Bagging), similar to the neural network, can build the SINS/GPS position model based on current and some past samples of SINS velocity, attitude and IMU output information. The performance of the proposed algorithm has been experimentally verified using GPS and SINS data of different trajectories collected in some land vehicle navigation tests. The comparison results between the proposed model and traditional algorithms indicate that the proposed algorithm can improve the positioning accuracy for cases of SINS and specific GPS outages.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号