首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 111 毫秒
1.
2.
小麦产业涉及国家粮食安全和民生问题,通过对小麦产量进行科学准确的预测,对农业经济的发展、制定粮食进出口计划和确保国家粮食安全有重要意义。使用相关性分析遥感参数与产量之间的相关性,通过随机森林算法对特征变量进行重要性评价,剔除对目标相关性无关或影响较小的特征变量,最后,采用BP神经网络对产量进行预测。结果表明:归一化植被指数(Normalized Difference Vegetation Index, NDVI)在天水市整个冬小麦生育期内都与产量呈正相关关系;相对湿度、NDVI、最低温度、土壤湿度和辐照度为小麦产量预测的重要影响因子;与未进行特征变量筛选的情况相比,冬小麦产量预测的精准度显著提升,可以满足产量预测的精度要求,为相关的农业部门提供可靠的农情信息,为制定粮食政策与组织粮食生产提供参考依据。  相似文献   

3.
fMRI数据是典型的高维小样本数据,如何从高维数据中提取和选择重要的特征是正确分类识别的关键.结合fMRI数据自身特点,提出了一种应用随机森林算法进行特征选择的方法,以随机森林分类精度为准则函数对特征进行重要性度量的方式实现特征选择.将本方法应用于健康者和精神分裂症患者的识别中,通过计算每个特征对分类的贡献度,优选出贡献度大的特征用于分类识别,同时根据重要特征的序号定位到相应脑区,给临床诊断提供客观参照.实验结果表明,该方法具有较好的效果.  相似文献   

4.
《现代电子技术》2019,(12):117-121
肝癌是一种我国高发的消化系统恶性肿瘤,患者死亡率高,威胁极大。而其预后情况通常只能通过医生的专业知识和经验积累来粗略判断,准确率较差。因此文中在分析随机森林算法的基本原理的基础上,提出一种改进的基于随机森林的特征筛选算法,并应用Python编程设计了一个能够预处理数据、调用这些算法、控制各参数并展现测试结果的系统,最终将该系统应用于肝癌预后预测,比较分析了不同的算法、参数、内部策略对预测精度和计算性能的影响。研究结果表明,随机森林相比剪枝过的决策树具备更好的泛化能力和训练速度,改进的特征筛选算法能够在保证预测精度的前提下显著缩小特征集。  相似文献   

5.
机器学习伴随着海量数据的支持以及强大的计算能力为其提供了强有力的保证下不断地向前发展,训练过程变得更加高效便捷.在此基础上,机器学习算法的超参数对其性能的影响是非常巨大的,因此对众多的超参数进行优化选择就自然有了强烈的需求.由此本文提出了一种基于量子遗传的超参数自动调优算法,实验表明,在针对多种机器学习模型的超参数调优...  相似文献   

6.
随着信息技术的发展,工业互联网技术已经被应用到工业大数据生产的各个环节,基于大数据技术的数据采集、数据存储、数据处理、数据分析和数据可视化等模块的技术应用也越来越走向成熟和高端。但是数据异常在生产过程中带来的风险始终是企业不可忽视的问题。文章对工业大数据的实时数据进行特征提取、数据处理,采用随机森林算法对工业大数据进行训练、构建模型,将实时数据输入模型中,动态更新参数以提高模型的分类精度,输出分类结果,最终在工业生产过程中对工业大数据进行故障预警并进行故障分析。  相似文献   

7.
王铮  任华  方燕萍 《电信科学》2016,32(12):7-12
电信运营商有大量数据,但是鉴于多种原因,数据的质量不够理想,出现大量数据不完整甚至缺失。对于已有数据的挖掘,必须在数据满足质量要求且达到足够采样比例的前提下开展。依托现有的全国日志留存系统,设计完整数据的模板样库,鉴别不能满足质量要求的数据,使用随机森林算法,找到最符合的相同或相关数据,补全数据并提升数据质量;用回溯反馈的方法优化并扩充模板样库。在全国日志留存系统中构建数据补全子系统,实现端到端的数据质量保障和提升,补全并改善历史数据甚至实时数据的质量,最终满足数据处理和挖掘的要求,提升运营商数据质量和价值。  相似文献   

8.
孙悦  袁健 《电子科技》2019,32(4):60-64
针对基于单机的经典随机森林算法无法满足海量数据处理需求的问题,文中采用Spark分布式存储计算技术设计并实现了改进的随机森林算法。首先计算特征的重要程度,将特征分为公共特征、独有特征和非重要特征;然后按顺序和比例分别在各个特征子空间中随机选择特征;最后通过Spark集群进行实验,分析改进的随机森林算法分类性能、加速比和效率。结果证实改进的算法提高了随机森林构建效率,可以用来解决海量数据挖掘问题,具有良好的可扩展性。  相似文献   

9.
血管疾病严重威胁着人类的健康,高发病率、高致残率、高死亡率是心血管疾病的主要特点,因此心血管疾病的预测研究显得尤为重要.本文探讨了随机森林算法在心血管疾病预测中的应用效果.在Kaggle网站上下载关于心血管疾病的数据集,用随机森林算法进行训练,实验结果由准确性、精度、召回率、F1-score评价标准来评价其性能的好坏(...  相似文献   

10.
11.
文章主要以数据挖掘算法的性能优化作为出发点,研究了相关的聚类算法,根据近些年来国际上对于聚类算法的原理、关键技术的研究分析了相关聚类个数K的相关作用和影响。希望通过文章的研究和报道能够对研究数据挖掘提供帮助,使得研究更够朝着更加有效和便捷的方向前进。  相似文献   

12.
客户流失预测能够帮助运营商制定有针对性的挽留营销政策,对提高竞争力和营业收入有重要意义.本文针对随机森林算法在数据和类别不平衡情况下预测准确率下降的问题,在随机森林CART分类树算法的特征选择过程中引入客户生命周期价值指标,降低了不平衡情况下的基尼系数和模型的不纯度.对电信业客户基本信息、行为数据和交互数据进行数学挖掘...  相似文献   

13.
从非线性无约束问题的最优化方法出发,讨论了BP算法及其改进算法的数学本质和其中蕴含的最优化思想,总结了其中的数学思想和基本规律,为BP算法中收敛速度的改进指出一个科学的研究思路,最后编程实现一个传统的改进算法,并应用到异或问题中验证了优化思想及所采用的启发式信息对BP算法收敛速度的显著提高.  相似文献   

14.
为了提高激光雷达融合图像的图像质量,设计了一种改进型正则化算法。该算法将稀疏表示加权编码以参数形式引入正则化算法,用于合理分配抑制噪声类型的权重以及提高算法鲁棒性。推导了包含迭代系数h与正则项参数λ的目标函数,给出了算法实现的具体流程步骤。实验对包含散粒噪声的融合图像进行优化,结果显示,随着h的增大图像质量提高,当h达到40后图像质量趋于稳定。当λ∈(0,0.5),随着λ的增大图像质量提高,当λ∈(0.5,1.0),随着λ的增大,图像质量下降。由此可见,本算法在h=40,λ=0.5时达到最优解,并且其时效性优于传统算法。由此可见,本算法在融合图像的图像质量增强方面具有一定的应用价值。  相似文献   

15.
Aiming at the defect of vote principle in random forest algorithm which is incapable of distinguishing the differences between strong classifier and weak classifier,a weighted voting improved method was proposed,and an improved random forest classification (IRFCM) was proposed to detect Android malware on the basis of this method.The IRFCM chose Permission information and Intent information as attribute features from AndroidManifest.xml files and optimized them,then applied the model to classify the final feature vectors.The experimental results in Weka environment show that IRFCM has better classification accuracy and classification efficiency.  相似文献   

16.
随机集理论在数据融合中的应用研究   总被引:2,自引:1,他引:1  
数据融合研究的重点是建立一个具有严格数学基础的框架体系,随机集理论是解决这一问题的有效方法。在介绍随机集理论基本原理的基础上,阐述了数据融合系统中使用较多的证据理论、模糊逻辑和条件事件代数理论的随机集表示,使随机集理论能有效地处理数据融合系统中的不确定性、模糊性、经验性数据。  相似文献   

17.
为提高低分辨力红外图像的分辨力,提出了一种红外图像超分辨力算法。该算法训练2个随机森林模型:红外图像训练第1个模型、配准的多传感器图像训练第2个模型。采用自适应边缘提取算法提取红外图像与可见光图像的边缘,计算输入的低分辨力红外图像块与对应的高分辨力可见光图像块之间的相关系数。根据相关性选择合适的重建模型,用选择的模型重建高分辨力红外图像块,并整合为高分辨力红外图像。实验结果表明,与超分辨力随机森林算法相比,算法重建的高分辨力红外图像具有更高的客观指标,峰值信噪比(PSNR)平均提升了0.09 dB,并且获得更为清晰的主观视觉效果,更接近原始图像。  相似文献   

18.
Multidimensional Systems and Signal Processing - The recent growth of World Wide Web (WWW) and development of the next-generation internet facilitates a huge amount of data being conveniently...  相似文献   

19.
《现代电子技术》2019,(11):161-164
针对传统数据挖掘算法只适用于小规模数据挖掘处理,由于数据规模不断增大,其存在计算效率低、内存不足等问题,文中将MapReduce用于数据挖掘领域,对大数据挖掘中的MapReduce进行了并行化改进,并设计相应的并行化实现模型,以期满足大数据分析需求,完成低成本、高性能的数据并行挖掘与处理。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号