首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
针对品种鉴别中面临的SNP(Single Nucleotide Polymorphisms)数据高维小样本的难点,研究利用少数高信息量SNP位点正确鉴别品种的方法,提出了一种新的SNP位点筛选方法。先利用PCA提取SNP主要位点,随后使用随机森林方法,根据平均精度下降和Gini指数下降对主位点的重要性进行评估,训练分类模型。最后分别选取重要度排名前48和96的位点,以这些位点为分类特征,建立分类模型进行品种鉴别。将该模型应用于6种绵羊Illumina OvineSNP50的SNP数据。实验表明,可以从46 013个位点中分别筛选出49、96个高信息量位点用于品种鉴别,鉴别准确率达到97%以上。该方法减少了用于品种鉴别的SNP位点个数,降低了品种鉴别成本。  相似文献   

2.
本文针对不同花椒品种的快速鉴别方法进行研究,以花椒的气味信息检测为研究对象,利用自行研制的电子鼻系统采集了6类花椒样品气味数据,对这些数据样本进行特征提取,得到了56组训练样本和32组测试样本。利用BP神经网络、概率神经网络和支持向量机对特征数据进行鉴别,正确识别率分别为89.58%、93.23%、94.27%,相对于BP神经网络和概率神经网络识别,支持向量机具有更好的分类效果。 本文研制的电子鼻系统能能无损、快速、准确鉴别花椒的品种,为农产品无损检测的研究提供了一种新的思路。  相似文献   

3.
刘翠玲  林珑  于重重  吴静珠 《计算机仿真》2020,37(3):189-192,283
利用高光谱成像技术对不同品种的花生进行快速无损分类。选取五种不同品种的花生,分别为东北小花生、富硒黑皮花生、花育36号、鲁花01号、鲁花09号,每种15颗,共75颗花生作为样本,采集400nm-1000nm波长范围内的高光谱图像,随机将6个特征波段(416nm、518nm、572nm、633nm、746nm、928nm)下的450个样本图像以2:1的比例分成训练集和测试集,建立基于深度学习的卷积神经网络模型。实验中所采用的网络模型为具有22层深度网络的GoogleNet模型,其中将dropout_ratio修改为0.6,训练集最终准确率为96%,测试集平均准确率为93.3%,每种花生的识别率均在90%及以上。最后与传统光谱处理方法PLS-DA进行对比,发现基于深度学习模型的识别率明显优于PLS-DA,结果表明,利用深度学习方法对花生快速无损分类具有可行性。  相似文献   

4.
采用傅里叶变换红外光声光谱技术对10个品种的油菜籽样本进行品种鉴别。原始光声光谱卷积平滑后,首先采用全谱数据建立支持向量机鉴别模型,当RBF核函数的核参数γ值为0.01时,模型最大预测率为70%。利用方差分析的方法对全谱进行有效波长筛选,筛选后的波长用于建立支持向量机鉴别模型,当γ值取0.1时,模型的识别率和预测率均可达到100%。同时,采用偏最小二乘判别分析建立鉴别模型,作为支持向量机模型的对照,该模型的预测率仅为60%,明显低于支持向量机模型的预测精度。研究表明,红外光声光谱技术结合支持向量机,在油菜籽品种鉴别中有良好的应用性能。  相似文献   

5.
为了使分类器能够在某个强度级别的行为样本集上训练而在其他强度级别上正确分类行为,提出了行为识别的随机逼近模型。在训练阶段从加速度计的时间序列数据提取特征,然后将特征送入聚类算法。数据依据行为聚类,聚类的均值和方差组合成相对应的SAM。在识别随机行为阶段,测试样本和每种行为类别的SAM进行比较。利用聚类算法和随机逼近给每种行为创建模型,然后使用启发式随机逼近最近邻方法来对行为进行分类。在实验中结合k-均值和高斯混合模型两种聚类算法,验证了提出的随机逼近模型的性能优于其他几种流行的行为分类方案。  相似文献   

6.
建立了10种药血竭的红外光谱、荧光光谱指纹图谱,并把图谱信息进行数据化及数据标准化处理;利用相关系数定量地对10种血竭的光谱指纹图谱进行了相似性评价;在此基础上用系统聚类分析法定性地对这10种样品进行了分类和鉴别,从而建立了一种基于中药血竭光谱指纹图谱的模式识别方法。为中药血竭的质量评价和分类鉴别提供了一个很好的方法和思路。  相似文献   

7.
草种精细识别对三江源区草地生态系统退化监测具有重要意义。基于无人机高光谱遥感系统,获取三江源草地退化典型区的高光谱影像。在对原始光谱特征利用XGBoost进行优化选择的基础上,结合扩展形态学属性剖面特征,利用稀疏多项式逻辑回归与自适应稀疏表示两种分类方法分别对影像上的不同可食与毒杂草种进行精细识别,在此基础上提出形状自适应的后处理方法对识别结果进行平滑处理。结果表明:①利用XGBoost方法选择出重要性高的光谱特征能提升高光谱数据的识别效果并节省运行时间;②利用空间—光谱特征的识别方法相较于仅利用光谱特征的方法可以有效改善草种识别效果,使总体精度提升4%~5%;③利用两种稀疏表示方法在小样本的情况下对草种精细识别的精度分别达到94.07%、93.15%,利用形状自适应后处理方法能有效提高多种毒杂草种的识别精度,使得总体精度分别提升约1.64%和1.12%。基于特征挖掘的稀疏表示分类方法能实现高精度的无人机高光谱影像草种精细识别,为更大范围的草原物种精细识别提供了技术支撑。  相似文献   

8.
手写签名鉴别技术作为生物特征安全认证领域的重要技术之一,具有广泛的应用前景。为了提高手写签名鉴别的正确性,提出一种基于三层小波变换和CPN神经网络结合的方法。首先对手写签名样本图像采取滤波去噪、二值化、细化、归一化等预处理措施,然后使用离散DB3小波分解提取高通系数矩阵处理后作为样本特征进行提取,而后采用CPN神经网络分类器对4680个训练样本进行每样本7500次训练,最后使用训练完毕的分类器对待鉴别样本进行分类鉴别。在由36个鉴别实验组组成的实验数据集上,样本识别正确率达到了93.48%。通过多种方法的对比实验,结果表明该方法签名特征提取全面、分类识别效果明显优于线性分类器。  相似文献   

9.
目的 随着高光谱成像技术的飞速发展,高光谱数据的应用越来越广泛,各场景高光谱图像的应用对高精度详细标注的需求也越来越旺盛。现有高光谱分类模型的发展大多集中于有监督学习,大多数方法都在单个高光谱数据立方中进行训练和评估。由于不同高光谱数据采集场景不同且地物类别不一致,已训练好的模型并不能直接迁移至新的数据集得到可靠标注,这也限制了高光谱图像分类模型的进一步发展。本文提出跨数据集对高光谱分类模型进行训练和评估的模式。方法 受零样本学习的启发,本文引入高光谱类别标签的语义信息,拟通过将不同数据集的原始数据及标签信息分别映射至同一特征空间以建立已知类别和未知类别的关联,再通过将训练数据集的两部分特征映射至统一的嵌入空间学习高光谱图像视觉特征和类别标签语义特征的对应关系,即可将该对应关系应用于测试数据集进行标签推理。结果 实验在一对同传感器采集的数据集上完成,比较分析了语义—视觉特征映射和视觉—语义特征映射方向,对比了5种基于零样本学习的特征映射方法,在高光谱图像分类任务中实现了对分类模型在不同数据集上的训练和评估。结论 实验结果表明,本文提出的基于零样本学习的高光谱分类模型可以实现跨数据集对分类模型进行训练和评估,在高光谱图像分类任务中具有一定的发展潜力。  相似文献   

10.
木材化学分类法的研究较少。通过木材的化学成分和化学计量学方法,从分子的角度鉴别珍贵木材,具有重要意义。本文通过GC-FID实验,采集阔叶黄檀等5种18批次的红木样本的色谱数据,所建立实验方法重现性好。将所得色谱数据,进行色谱峰对齐和自标度化预处理,然后PCA投影。12个建模样本被分成4类,与各样本已知的植物学分类一致。以所建立的分类方法(即PCA投影空间),识别其余6个待鉴别样本,结果准确达到分离聚类。本方法利用现代分析仪器和模式识别法实现了对红木的分类和识别,为珍贵木材的化学分类鉴别法提供理论依据。  相似文献   

11.
数据集中数据之间往往相互关联,所有数据整体上呈现特定的模式结构,而传统分类方法(如支持向量机)忽略数据关联信息,仅仅利用数据的物理特征(如距离、相似性等)构建数据分类模型,并在分类阶段计算测试样本与所建立分类模型间的相似性来预测测试样本的标签类型。为了解决传统分类方法利用单一数据信息的问题,提出一种挖掘数据模式结构信息的混合数据分类方法。该方法融合了两种不同类型的分类技术,将使用单一数据物理特征的传统分类方法作为普通分类方法,将利用数据模式结构信息的分类方法作为高级分类方法。特别地,该方法不仅可有效地识别数据模式结构信息以提高数据分类性能,还能提高传统分类方法的泛化能力。在人造数据集和UCI真实数据集上的大量实验结果表明了该混合数据分类方法的有效性,其分类性能优于传统分类方法。  相似文献   

12.
基于基因表达谱提出了一种依据类加权Bhattacharyya距离提取特征基因并使用人工神经网络(ANN)进行肿瘤亚型识别的方法。分析了儿童小圆蓝细胞瘤(SRBCTs)的基因表达数据后,在训练样本集上计算出各个基因的类加权Bhattacharyya距离,并据此选择特征基因构造若干ANN模型,利用独立测试集验证其分类能力,且依据分类错误率最小的原则确定了含40个基因的特征基因组合。基于该特征基因组合的ANN模型不仅正确地识别了所有的患病样本的亚型,还能鉴别非患病样本。  相似文献   

13.
李青 《自动化仪表》2022,(12):123-128
为了提高城市交通信息管理能力、交互能力和处理能力,提出了基于XGBoost融合模型的交通流量预测系统。构建了梯度方向直方图(HOG)特征信息模型,采用支持向量机(SVM)分类器对城市交通信息进行识别,增强了道路信息识别能力。同时,构建了基于XGBoost融合模型的交通流量预测系统。XGBoost融合模型将分类回归树(CART)作为基分类器,应用Label Encoding和one-hot Encoding方式实现原始数据集的编码,集成多个决策树模型,共同决定样本的预测结果。通过调整模型参数,可防止出现过拟合。通过对不同数据信息进行分类,提高了数据监控能力。试验结果表明,该研究对车辆图像的识别率较高,对交通流量的预测数据的误差百分比始终低于0.1。该研究能够加强城市交通系统监控,提高交通数据信息分析和应用能力。  相似文献   

14.
张帆  杜博  张良培  张乐飞 《计算机科学》2014,41(12):275-279
如何准确识别图像中的类别信息,是计算机视觉和模式识别领域的重要研究问题。遥感卫星图像数据,尤其是高光谱等遥感图像数据的出现,将空间信息与光谱信息集成于同一数据集中,丰富了图像信息来源。如何准确地识别高光谱图像中的地物类别,已经成为了图像处理和模式识别领域的热点问题。面向高光谱图像数据提出了一种基于波段分组特征和形态学特征的高光谱图像分类方法,结合空间和光谱特征提高分类精度。通过真实的高光谱数据实验证明:利用波段分组可以有效地保持光谱特征,降低数据冗余;在波段分组基础上结合形态学特征进行分类,比传统分类方法的分类精度明显提高。  相似文献   

15.
采用傅里叶变换红外光谱,测定了45个来自青海省不同产地的枸杞样品的红外光谱。小波变换对红外光谱原始数据进行了预处理。红外光谱数据压缩到原来的1/8,其分析精度与原始光谱数据基本相当。将45个样本数据分为30个训练集和15个测试集,建立随机森林(RF)预测枸杞产地模型,使用内部交叉验证和外部数据进行验证。采用R语言实现随机森林算法,并对模型的参数进行了优化。结果,所建立的判别模型中训练样本判别正确率为100%,测试样本判别正确率为100%。研究结果表明,建立的模型能够正确地对枸杞样品快速地进行产地鉴别,红外光谱法结合随机森林可作为中药材产域分类鉴别的一种新的现代化方法。  相似文献   

16.
零样本图像分类旨在识别训练时从未出现过的全新类别(未见类别),为此需要利用辅助信息建模未见类和可见类之间的关系。利用图卷积网络(GCN)进行零样本分类的模型可以借助知识图显式地表达类别之间的关系,但 GCN 易受过平滑影响,导致模型性能下降。针对此问题提出了基于随机传播图卷积模型的零样本图像分类方法。该方法使用随机传播机制处理原始特征以达到特征扰动和数据扩增的目的;利用数据中类别层级生成的知识图建模类别之间的语义关系。其中,图中节点代表类别,节点间的边代表类别之间的关系。再构建 GCN对处理后的特征进行训练,从节点中输出包含未见类别的分类器参数,进而实现零样本图像分类。实验结果表明,该方法可以有效地改善零样本图像分类中的时间消耗、分类精度和泛化性能。  相似文献   

17.
针对工业制品缺陷分类存在的样本图像少、分类准确性不足和模型训练耗时长等问题,提出了一种基于深度森林的人机协同分类模型.该模型首先通过深度森林对样本图像进行初步识别,经多粒度扫描模块和级联森林模块提取特征,得到初始预测结果并分离出识别困难的样本图像;然后采用人机协同的策略,采用人工方式随机标注部分识别困难的样本,再利用K近邻算法对剩余识别困难的样本进行再分类.通过在公开数据集以及生产线实际采集的真实数据上的实验结果表明,改进的分类模型在工业制品表面缺陷数据集上的性能优于基线算法.  相似文献   

18.
基于HJ-1A高光谱遥感数据的湟水流域典型农作物分类研究   总被引:1,自引:0,他引:1  
利用高光谱遥感技术识别农作物类型已经成为高光谱遥感研究的热点领域。以青海省湟水流域内油菜、小麦和青稞等典型农作物为分类对象,以HJ-1A HSI高光谱数据和GF-1 WFV高分辨率数据为数据源,探讨利用高光谱遥感影像进行农作物类型信息提取的方法。数据经预处理后,首先,利用WFV数据采用面向对象方法提取研究区农作物种植边界,并利用其对HSI高光谱影像进行种植区域提取;其次,将提取后的高光谱影像经数据形式变换获得包括:R、1/R、Log(R)、d(R)、d(Log(R))和CR共6种数据形式;最后,利用上述6种数据形式的全波段数据和经遗传算法GA-SVM进行光谱波段选取后的6种特征数据,采用支持向量机SVM方法进行农作物分类。结果表明:采用基于样本的面向对象分类方法提取耕地信息精度高且实现周期短;利用GA-SVM波段选取后的6种特征数据集进行农作物分类,其精度显著高于全波段数据集分类精度;6种数据变换形式中,d(Log(R))和CR是两种最优的高光谱分类数据形式,其全波段和特征波段数据进行农作物分类均能获得较好的分类精度,总体精度最高分别达88%和86%,而采用1/R、Log(R)和R数据形式需经GA-SVM光谱波段选取后才能获得较优分类精度。  相似文献   

19.
为全面实现歧义消解,对知识库自然语言中歧义字段自动识别系统设计。利用互信息进行歧义字段特征识别,采用正向与逆向相结合的提取方式,将字段特征集合描述为二维向量,通过循环方式提取歧义字段显性特征;建立模型进行最优线性分类识别,选择最佳样本识别条件,建立最优分类超平面并确立分类函数。通过性能衡量指标构建软硬件系统结构,结合识别算法设置工作流程,经功能设计进一步提高识别精度。仿真实验表明该系统不受数据规模影响,可有效提高识别精度,减少系统处理时间,实现对歧义字段的高精度、高效率识别。  相似文献   

20.
为提高危险化学品被动红外遥测光谱鉴别正确率,提出应用支持向量机建立鉴别模型。利用野外实测氨气被动红外遥测光谱样本集,变换惩罚因子C对比高斯核函数与多项式核函数的效能,结合网格遍历法搜寻最佳模型参数,建立了基于支持向量机的鉴别模型。基于40个训练样本得到的模型,对包含267个样本的测试样本集的鉴别正确率可达93.6%,明显优于3层网络结构的BP神经网络鉴别模型。实验结果表明,支持向量机鉴别模型是一种有效的危险化学品红外遥测光谱鉴别方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号