共查询到20条相似文献,搜索用时 703 毫秒
1.
2.
3.
4.
基于机器学习算法建立分类预测模型,研究常见食品中化学性污染物的理化结构与其神经毒性间关联。通过查阅文献建立化合物数据库,纳入包含影响神经分化成熟、影响神经元迁移/空间定向等各类神经毒性机制化合物57种,无神经毒性化合物50种。运用R、SPSS软件,使用随机森林(Random Forests,RF)、类神经网络(Artificial Neural Network,ANN)、支持向量机(Support Vector Machine,SVM)等机器学习算法筛选分子描述符并构建分类模型,预测化合物神经毒性。结果显示随机森林算法模型综合表现最佳,十折交叉验证准确率70.24%,训练集、测试集预测准确率分别达95.51%和83.33%,曲线下面积分别达0.99和0.85,是个较为理想的算法。本研究基于机器学习算法建立的分类模型可通过化合物的分子描述符准确预测化合物的神经毒性。在多种机器学习算法中,基于随机森林算法建立的预测模型表现最优。分子描述符重要性结果显示,化合物神经毒性主要与其质量加权Burden矩阵最大特征值有关。 相似文献
5.
《科技创新与应用》2021,11(17)
文章利用SPOT6卫星影像数据和随机森林模型对城市土地利用进行精细化分类研究。首先,利用Gram-Schmidt法将SPOT6卫星影像的1.5m全色数据和6m多光谱数据进行融合,然后采用面向对象软件分类方法进行多尺度分割,通过交互式确定最优分割尺度和分割参数,对分割后的影像对象采用随机森林模型分类进行10类地物分类实验,并与传统的最近邻分类方法对比。结果表明,利用随机森林模型分类方法得到了非常好的分类结果,其分类精度达到87.46%,Kappa系数是0.855,比最近邻分类方法的分类精度和Kappa系数分别提升了7%与0.06。研究结果可为SPOT6卫星影像数据的未来应用提供借鉴和参考。 相似文献
6.
7.
目的 食品不合格指标危害人类饮食健康,本文将数据挖掘技术应用于食品安全检测中。方法 通过收集山东省食药局官方网站下发的2015~2019年食品安全抽样检验产生的不合格数据,并对其进行多项数据预处理操作,采用超参数网格搜索和10折交叉验证方法建立了基于随机森林的食品不合格指标的分类预测模型,另外,通过对传统随机森林模型的参数优化,将其与决策树(DT)、逻辑回归(LR)和梯度提升决策树(GBDT)算法分类预测结果进行了对比。结果 实验表明经过参数优化后的随机森林模型对食品中不合格指标的预测准确率能够达到89.4%,比DT算法提高了11%,比LR算法提高了9%,比GBDT算法提高了8.1%。结论 基于优化的随机森林模型可以完成食品不合格指标分类预测任务,有广阔的应用前景。 相似文献
8.
9.
为实现对市面上常见以及实际案件中出现的动物油样本进行快速无损识别,借助光谱分析技术和机器学习算法,基于连续分类策略,对不同动物油样本在种类及品牌/来源地方面进行区分和认定。收集了247份动物油样本(鸡油、牛油、鹅油、猪油、羊油、鸭油),对其进行红外光谱扫描,采用自动基线校正和峰面积归一化消除样本基线漂移和量纲不一致情况;再分别采用Savitzky-Golay平滑、二项式平滑、邻域平均法、FFT滤波、一阶导数和二阶导数对红外光谱进行预处理,比较了6种预处理方法在降噪方面的差异性,同时构建不同预处理方法下的随机森林、贝叶斯网络以及最小二乘支持向量机3种分类模型,开展各样本“种类—品牌/来源地”的连续分类工作。结果表明,相较于未预处理模型,经过预处理后,模型的识别能力均有提升,其中采用FFT滤波预处理结合随机森林模型可较好区分6种动物油,其对6种动物油样本品牌/来源地的识别准确率由高到低依次为鸡油、牛油、鹅油、猪油、羊油、鸭油;对实际案件中2份检材进行验证性分析,结果与实际情况相符合。红外光谱结合机器学习算法可应用于基于连续分类策略的动物油的快速无损识别。 相似文献
10.
将机器学习算法和文本挖掘融入酱卤肉制品货架期预测中,基于对文献数据库中酱卤肉制品的货架期及其影响因素(包装方式、储藏方式、保鲜剂和二次杀菌)进行收集,构建原始数据集;通过比较多种编码方法(JamesStein、BaseNEncoder、TargetEncoder、OrdinalEncoder、PolynomialEncoder),选择效果较好的JamesStein编码作为分类型特征变量的编码方式。通过比较多种机器学习算法(包括随机森林算法、K最近邻算法、逻辑回归、XGboost和多层感知机分类器),结果显示最优模型为随机森林算法[其准确度为0.95、精确度为0.97、曲线下面积(area under curve,AUC)值为0.99,F1-score 0.91]。通过对酱牛肉和盐水鸭的实际样品测试分析,发现该模型在预测不同酱卤肉制品的货架期方面均具有较高的准确性。此外,该文从另一个角度验证储藏温度、包装方式、保鲜剂和二次杀菌等因素对酱卤肉制品货架期的显著影响。 相似文献
11.
12.
目的:设计一种基于计算机视觉技术结合深度学习模型的新方法检测八角粉的掺假情况。方法:采集不同掺假比例八角粉的原始图像,利用预处理和数据增强技术获得图像集合。随后构建SqueezeNet深度学习模型,并与支持向量机(support vector machine,SVM)、K-邻近学习(K-nearest neighbor learning,KNN)、随机森林(random forest,RF)、梯度提升树(gradient boosting tree,GBT)和多层感知器(multilayer perceptron,MLP)5种机器学习模型进行比较。结果:5种机器学习模型的最高准确度仅为66.37%,而SqueezeNet模型的准确度为99.42%。结论:深度学习分类模型性能相较于传统机器学习分类模型更为优越,识别效果良好且样品无需预处理。 相似文献
13.
14.
15.
16.
目的 基于机器学习算法,对同样重量范围下的牡蛎按照肥满度高低进行分类。方法 首先利用数字图像处理技术提取牡蛎外部形态特征, 获得牡蛎的粗糙度,伸长率,紧密度,长轴,短轴,面积等特征指标作为参数。然后利用机器学习算法在数据分析上的强大功能,采用随机森林(random forest, RF)算法与梯度提升决策树 (Gradient Boosting Decision Tree, GBDT) 算法分别构建肥满度识别模型。最后,将模型用于不同重量范围的牡蛎样本,对牡蛎进行肥满度识别分类。结果 对于0~50g的牡蛎, RF算法能取得较好的效果,肥满度识别率达到79.3%,50~100g的牡蛎,GBDT算法的肥满度识别率达到86.4%。结论 相对于传统的按照重量对其肥满度分类而言,本方法能够快速有效的识别出相同重量范围下牡蛎肥满度的高低, 为牡蛎分类提供了新的方法。 相似文献
17.
18.
机器学习和数据挖掘算法在高光谱高空间分辨率遥感影像中得到了极大的发展。文章以靖远县地区的Landsat-8OLI数据,经矫正融合后,选取最优分割尺度,并选取最优特征空间,基于WEKA平台对比了J48分类算法、KNN分类算法、SMO分类算法。实验表明SMO算法的分类效果优于KNN算法分类效果,J48算法分类效果最差。 相似文献
19.
20.
高光谱遥感是将成像技术和光谱技术相结合的多维信息获取技术。自发展以来,已在各个方面都显示出了巨大的研究潜力,成为遥感应用最广泛的领域之一。然而,如何充分利用高光谱遥感数据提供的丰富的地表信息,以及如何在如此大量的信息中提取有用信息,是摆在研究者面前的一项重要课题。高光谱遥感影像处理的一项重要内容就是地物目标的分类。文章基于支持向量机算法原理,提出了一种应用于高光谱影像的分类机制,并在印度松树(Indian Pines)和帕维亚大学(Pavia University)数据集上进行了验证实验,取得了较高的分类精度。 相似文献