首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 703 毫秒
1.
21世纪以来,面向对象的影像分析方法快速发展,在高分辨率影像中的应用日益增加,同时也体现了其优势。目前,基于机器学习算法的分类方法开始普遍运用,不再局限于基于规则集的面向对象影像分类方法,这些算法相对于基于规则集的分类算法,精度有所提高,文章基于随机森林与J48决策树机器学习算法,利用WorldView2影像,进行了中卫市西南部分地区的土地覆被分类,并得到了显示效果较好的土地覆被分类图。文章的结果表明,面向对象的机器学习算法精度较高,并能适用于各种复杂的研究区,其中,针对文章研究区影像,基于随机森林的分类方法精度更高。  相似文献   

2.
朴素贝叶斯算法是一种基于概率统计的分类算法,广泛应用于机器学习中分类问题的求解中。文本分类是自然语言处理和数据挖掘领域中的研究热点有着广泛的应用前景。朴素贝叶斯算法已经在文本分类中取得了较好的分类效果,但是由于文本词向量的特征向量维度高,很多分类算法的求解效率和准确率都不高。文章提出一种基于词向量间余弦相似度的改进朴素贝叶斯算法,有效的降低了特征向量的数据冗余和计算复杂性。  相似文献   

3.
文本分类在文本预处理中占据着重要的地位,针对文本分类过程中输入数据维数高,导致特征提取,分类器选择困难等问题,提出一种基于稀疏自动编码器与集成学习的文本分类算法。该算法首先通过稀疏自动编码器进行输入数据的特征表示,然后利用极限学习机作为基分类器进行文本分类,最后通过Adaboost集成学习方法将基分类器组合成为分类效果更好的集成分类器。实验结果表明,该方法可以有效提高文本分类的准确度。  相似文献   

4.
基于机器学习算法建立分类预测模型,研究常见食品中化学性污染物的理化结构与其神经毒性间关联。通过查阅文献建立化合物数据库,纳入包含影响神经分化成熟、影响神经元迁移/空间定向等各类神经毒性机制化合物57种,无神经毒性化合物50种。运用R、SPSS软件,使用随机森林(Random Forests,RF)、类神经网络(Artificial Neural Network,ANN)、支持向量机(Support Vector Machine,SVM)等机器学习算法筛选分子描述符并构建分类模型,预测化合物神经毒性。结果显示随机森林算法模型综合表现最佳,十折交叉验证准确率70.24%,训练集、测试集预测准确率分别达95.51%和83.33%,曲线下面积分别达0.99和0.85,是个较为理想的算法。本研究基于机器学习算法建立的分类模型可通过化合物的分子描述符准确预测化合物的神经毒性。在多种机器学习算法中,基于随机森林算法建立的预测模型表现最优。分子描述符重要性结果显示,化合物神经毒性主要与其质量加权Burden矩阵最大特征值有关。  相似文献   

5.
文章利用SPOT6卫星影像数据和随机森林模型对城市土地利用进行精细化分类研究。首先,利用Gram-Schmidt法将SPOT6卫星影像的1.5m全色数据和6m多光谱数据进行融合,然后采用面向对象软件分类方法进行多尺度分割,通过交互式确定最优分割尺度和分割参数,对分割后的影像对象采用随机森林模型分类进行10类地物分类实验,并与传统的最近邻分类方法对比。结果表明,利用随机森林模型分类方法得到了非常好的分类结果,其分类精度达到87.46%,Kappa系数是0.855,比最近邻分类方法的分类精度和Kappa系数分别提升了7%与0.06。研究结果可为SPOT6卫星影像数据的未来应用提供借鉴和参考。  相似文献   

6.
文章探索一种基于机器学习模型的服装品牌基因强度识别分析方法,通过利用品牌服装历史产品图像数据作为特征数据集,模仿人脑的学习认知过程,设计并训练基于机器学习算法的品牌分类模型,最终使机器学习模型能够"认知"到服装品牌的"基因片段"。以此模型的分析过程及特征提取结果来验证并分析"品牌基因"。采用机器学习的方法,利用品牌服装设计中的共性特征数据对品牌基因强度进行分析,可以避免主观评价的片面性和传统统计方法无法对非线性因素进行因果关联的缺点,通过大量的数据分析,实现对品牌基因的提取和应用。  相似文献   

7.
目的 食品不合格指标危害人类饮食健康,本文将数据挖掘技术应用于食品安全检测中。方法 通过收集山东省食药局官方网站下发的2015~2019年食品安全抽样检验产生的不合格数据,并对其进行多项数据预处理操作,采用超参数网格搜索和10折交叉验证方法建立了基于随机森林的食品不合格指标的分类预测模型,另外,通过对传统随机森林模型的参数优化,将其与决策树(DT)、逻辑回归(LR)和梯度提升决策树(GBDT)算法分类预测结果进行了对比。结果 实验表明经过参数优化后的随机森林模型对食品中不合格指标的预测准确率能够达到89.4%,比DT算法提高了11%,比LR算法提高了9%,比GBDT算法提高了8.1%。结论 基于优化的随机森林模型可以完成食品不合格指标分类预测任务,有广阔的应用前景。  相似文献   

8.
  目的  为提高烤烟的分类正确率。  方法  利用高光谱成像系统采集烤烟样本,采用Savitzky-Golay卷积平滑法(SG)、多元散射校正(MSC)、一阶导数法(FD)的组合方法对数据进行预处理。通过连续投影算法(SPA)选择特征波长,利用灰度共生矩阵(GLCM)选择烤烟的纹理特征,将纹理特征与光谱特征归一化处理后进行融合,利用邻近算法(KNN)、随机森林(RF)、支持向量机(SVM)、朴素贝叶斯(NB)验证烤烟分类效果。  结果  预处理后的全波长数据分类正确率较预处理前有所提升;利用SPA选择特征波段进行分类,正确率下降;高光谱融合纹理特征后进行分类,分类效果显著提升。  结论  基于高光谱与纹理融合可准确、有效地对烤烟进行无损分类,为量化烤烟分类提供了可行方法。   相似文献   

9.
邱薇纶  王晓庆 《中国油脂》2023,48(10):109-115
为实现对市面上常见以及实际案件中出现的动物油样本进行快速无损识别,借助光谱分析技术和机器学习算法,基于连续分类策略,对不同动物油样本在种类及品牌/来源地方面进行区分和认定。收集了247份动物油样本(鸡油、牛油、鹅油、猪油、羊油、鸭油),对其进行红外光谱扫描,采用自动基线校正和峰面积归一化消除样本基线漂移和量纲不一致情况;再分别采用Savitzky-Golay平滑、二项式平滑、邻域平均法、FFT滤波、一阶导数和二阶导数对红外光谱进行预处理,比较了6种预处理方法在降噪方面的差异性,同时构建不同预处理方法下的随机森林、贝叶斯网络以及最小二乘支持向量机3种分类模型,开展各样本“种类—品牌/来源地”的连续分类工作。结果表明,相较于未预处理模型,经过预处理后,模型的识别能力均有提升,其中采用FFT滤波预处理结合随机森林模型可较好区分6种动物油,其对6种动物油样本品牌/来源地的识别准确率由高到低依次为鸡油、牛油、鹅油、猪油、羊油、鸭油;对实际案件中2份检材进行验证性分析,结果与实际情况相符合。红外光谱结合机器学习算法可应用于基于连续分类策略的动物油的快速无损识别。  相似文献   

10.
将机器学习算法和文本挖掘融入酱卤肉制品货架期预测中,基于对文献数据库中酱卤肉制品的货架期及其影响因素(包装方式、储藏方式、保鲜剂和二次杀菌)进行收集,构建原始数据集;通过比较多种编码方法(JamesStein、BaseNEncoder、TargetEncoder、OrdinalEncoder、PolynomialEncoder),选择效果较好的JamesStein编码作为分类型特征变量的编码方式。通过比较多种机器学习算法(包括随机森林算法、K最近邻算法、逻辑回归、XGboost和多层感知机分类器),结果显示最优模型为随机森林算法[其准确度为0.95、精确度为0.97、曲线下面积(area under curve,AUC)值为0.99,F1-score 0.91]。通过对酱牛肉和盐水鸭的实际样品测试分析,发现该模型在预测不同酱卤肉制品的货架期方面均具有较高的准确性。此外,该文从另一个角度验证储藏温度、包装方式、保鲜剂和二次杀菌等因素对酱卤肉制品货架期的显著影响。  相似文献   

11.
《广西轻工业》2019,(7):68-71
网络技术发展和广泛应用导致Web数据量与日俱增,形成海量网络数据,如何从中获取有益信息,并对其进行分类管理是发掘海量网络数据隐藏价值的关键所在。本文基于PYTHON语言探讨如何从网络中抓取与研究目标相关数据,利用机器学习技术选择分类特征并对数据进行分类管理。对当下考研信息的获取和分类处理实例表明本文提出用网络爬虫、特征词选择和贝叶斯分类器相结合的方法是一种有效的海量网络信息获取和分类管理方法。  相似文献   

12.
陈劲星 《食品与机械》2023,39(12):42-47,69
目的:设计一种基于计算机视觉技术结合深度学习模型的新方法检测八角粉的掺假情况。方法:采集不同掺假比例八角粉的原始图像,利用预处理和数据增强技术获得图像集合。随后构建SqueezeNet深度学习模型,并与支持向量机(support vector machine,SVM)、K-邻近学习(K-nearest neighbor learning,KNN)、随机森林(random forest,RF)、梯度提升树(gradient boosting tree,GBT)和多层感知器(multilayer perceptron,MLP)5种机器学习模型进行比较。结果:5种机器学习模型的最高准确度仅为66.37%,而SqueezeNet模型的准确度为99.42%。结论:深度学习分类模型性能相较于传统机器学习分类模型更为优越,识别效果良好且样品无需预处理。  相似文献   

13.
为了消除进口棉花品级分类中由于检测人员主观性引起的观察偏倚,以及其与预警信息化和及时性不相符等矛盾,文章基于大容量棉花检测仪(HVI)的检测结果,提出运用随机森林算法来预测进口锯齿棉品级分类的方法。对HVI检测获得的原始数据进行标准化处理,并运用主成分分析降低指标维度,采用随机森林算法构建分类模型,将测试样本带入训练好的分类模型,可自动判别出测试锯齿棉的品级。实验结果表明该方法的分类效果较好,可有效实现锯齿棉品级的自动分类。  相似文献   

14.
随机森林算法(RF)是一种将决策分类树综合起来的预测及分类的算法,RF首先将众多分类树汇总起来,进而提高模型精度,由于随机森林利用的是Bootstrap方法进行抽样,进而产生许多个Bootstrap样本,建立新的分类模型,但是Bootstrap抽样方法也有它自身的缺点,降低了随机森林模型的效率和精确度。文章提出将改进的Bootstrap方法(BLB)运用到随机森林模型中,减少评估估计质量的计算成本,提高其分类预测的效率。  相似文献   

15.
  目的  利用高光谱成像技术和机器学习方法对烟叶中的非烟物质进行分类识别。  方法  使用可见—近红外高光谱成像技术,采用归一化(Normalization)、标准正态变化(SNV)、多元散射校正(MSC)、一阶导数(FD)、卷积平滑(SG)对光谱数据进行预处理,通过连续投影变换(SPA)和主成分载荷(PCA loadings)进行特征波长选择,并应用随机森林(RF)、Softmax和支持向量机(SVM)建立分类模型。  结果  SNV为最佳光谱预处理方法,SPA选择特征波长建立的SVM模型为最优模型,训练集和测试集正确率分别为99.82%和99.47%。  结论  高光谱成像技术结合SPA-SVM模型可以有效分类识别烟叶中的非烟物质。   相似文献   

16.
目的 基于机器学习算法,对同样重量范围下的牡蛎按照肥满度高低进行分类。方法 首先利用数字图像处理技术提取牡蛎外部形态特征, 获得牡蛎的粗糙度,伸长率,紧密度,长轴,短轴,面积等特征指标作为参数。然后利用机器学习算法在数据分析上的强大功能,采用随机森林(random forest, RF)算法与梯度提升决策树 (Gradient Boosting Decision Tree, GBDT) 算法分别构建肥满度识别模型。最后,将模型用于不同重量范围的牡蛎样本,对牡蛎进行肥满度识别分类。结果 对于0~50g的牡蛎, RF算法能取得较好的效果,肥满度识别率达到79.3%,50~100g的牡蛎,GBDT算法的肥满度识别率达到86.4%。结论 相对于传统的按照重量对其肥满度分类而言,本方法能够快速有效的识别出相同重量范围下牡蛎肥满度的高低, 为牡蛎分类提供了新的方法。  相似文献   

17.
在新的机型投入生产之前,需要安排每个零件的工艺路线,如果该工作能实现自动化,就可以事先快速地给出一个基本正确的方案,为后续的并行协调提供方便。文章将介绍使用机器学习技术建立工艺路线分工模型的思路和方法,首先是任务性质的分析、数据清洗、特征工程、one-hot编码等准备工作,然后使用随机森林算法训练工艺分工预测模型,对模型的性能进行审查,以及模型学到的内容进行解释,最后对更先进的机器学习技术在工艺路线分工中的应用进行展望。  相似文献   

18.
机器学习和数据挖掘算法在高光谱高空间分辨率遥感影像中得到了极大的发展。文章以靖远县地区的Landsat-8OLI数据,经矫正融合后,选取最优分割尺度,并选取最优特征空间,基于WEKA平台对比了J48分类算法、KNN分类算法、SMO分类算法。实验表明SMO算法的分类效果优于KNN算法分类效果,J48算法分类效果最差。  相似文献   

19.
目的/意义:专利是衡量企业技术创新能力的一项重要指标,通过对专利文本进行处理分析,得出客观有效的企业创新能力量化指标数据。方法/过程:以佰腾网2015-2019年间华为、小米、OPPO、ViVo四家手机厂商专利数据为例,结合机器学习思想,利用LDA主题模型和基于熵值法的权重计算,建立一套基于专利数据分析的企业技术创新能力评估方法体系。结果/结论:分析所得各项指标作为企业技术创新能力评价依据,并通过对国内主流手机制造企业进行评估比较,发掘评估方法体系对行业的现实意义。  相似文献   

20.
高光谱遥感是将成像技术和光谱技术相结合的多维信息获取技术。自发展以来,已在各个方面都显示出了巨大的研究潜力,成为遥感应用最广泛的领域之一。然而,如何充分利用高光谱遥感数据提供的丰富的地表信息,以及如何在如此大量的信息中提取有用信息,是摆在研究者面前的一项重要课题。高光谱遥感影像处理的一项重要内容就是地物目标的分类。文章基于支持向量机算法原理,提出了一种应用于高光谱影像的分类机制,并在印度松树(Indian Pines)和帕维亚大学(Pavia University)数据集上进行了验证实验,取得了较高的分类精度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号