共查询到19条相似文献,搜索用时 78 毫秒
1.
2.
《计算机应用与软件》2019,(9)
结合收集的住房月租金数据,通过合理处理异常缺失数据和设置多个数据集的预处理后,分别应用GBDT(Gradient Boosting Decision Tree)、Xgboost(eXtreme Gradient Boosting)和LightGBM三种机器学习模型对住房月租金进行预测。通过比较分析在不同数据集训练下的预测结果,发现Xgboost和LightGBM模型优于传统GBDT模型。同时发现影响住房月租金的关键因素主要包括房屋面积、小区所在商圈位置、房屋距离地铁的距离、房屋所在建筑的总楼层数和小区房屋出租数量等。预测模型及分析结果对住房租赁市场中住房租金价格的预测具有一定的参考价值。 相似文献
3.
针对极限学习机对滑坡预测准确性低及在训练过程中模型不稳定的问题,引入RBF高斯核函数并使用极限梯度提升树算法Xgboost对KELM进行优化,建立了Xgboost优化后的Xgboost-KELM预测模型;首先采用高斯核RBF作为极限学习机的核函数,解决隐藏节点随机映射问题,增加模型稳定性及适用性;其次将清洗后的监测数据作为模型输入,并使用Xgboost寻优算法对核函数中的超参数进行优化,通过4组测试集进行Xgboost-KELM建模,依据均方误差迭代曲线得出最佳超参数;最后使用两组10%样本集验证模型评价指标及稳定性,实验结果AUC均值对比模型至少提高3个百分点,Precision、Accuracy及Recall至少高于对比模型1.7个百分点,同时Xgboost-KELM模型的方差及偏差都较小,证明该模型稳定性较好,实验结果说明Xgboost-KELM模型具有较好的预测效果,在滑坡灾害预测中有较好的预测能力。 相似文献
4.
5.
6.
7.
针对传统欠采样方法对不平衡数据集重采样时,容易丢失多数类样本信息的问题,本文提出一种基于数据密度分布的欠采样方法US-DD,该方法引入数据密度的概念,并以此概念为依据将数据划分为高密度数据簇和低密度数据簇,高密度数据簇数据高度集中,低密度数据簇数据稀疏松散,两种不同数据簇对分类的意义也不同,因此可以针对不同密度的数据簇,执行不同的重采样策略,以达到改善数据平衡度的目的。实验通过选取6组UCI数据集,采用C4.5决策树、支持向量机作为分类器,将US-DD与随机欠采样、KNN-NearMiss等方法进行比较,实验结果表明,该方法对不平衡数据分类有较好的效果,能有效提升分类器对少数类的识别性能。 相似文献
8.
策略梯度估计方差大是策略梯度算法存在的普遍问题,基于参数探索的策略梯度算法(PGPE)通过使用确定性策略有效缓解了这一问题。然而,PGPE算法基于蒙特卡罗方法进行策略梯度的估计,需要大量学习样本才能保证梯度估计相对稳定,因此,梯度估计方差大阻碍了其在现实问题中的实际应用。为进一步减小PGPE算法策略梯度估计的方差,提出了基于值函数估计的参数探索策略梯度算法(PGPE-FA),该算法在PGPE算法中引入Actor-Critic框架。具体地,提出的方法使用价值函数估计策略梯度,代替了PGPE方法使用轨迹样本估计策略梯度的方式,从而减小梯度估计方差。最后,通过实验验证了所提算法能够减小梯度估计的方差。 相似文献
9.
针对高自由度的机械臂的灵活性和自主性问题,提出一种快速且高效的机械臂运动规划算法。通过动态运动基元(DMPs)模型对运动轨迹进行编码提取特征,作为运动轨迹先验知识,基于现在物理环境和目标任务设计无碰撞及高能效的目标泛函,通过对目标泛函进行梯度下降得出在该环境下的最优轨迹。为验证算法的有效性,通过机器人实验平台(v-rep)模拟机械臂的日常操作任务。实验结果表明,在整个工作空间内,机械臂通过少量的迭代(少于6次),便可生成无碰撞的运动轨迹,可降低能耗20%以上。 相似文献
10.
11.
在集成算法中嵌入代价敏感和重采样方法是一种有效的不平衡数据分类混合策略。针对现有混合方法中误分代价计算和欠采样过程较少考虑样本的类内与类间分布的问题,提出了一种密度峰值优化的球簇划分欠采样不平衡数据分类算法DPBCPUSBoost。首先,利用密度峰值信息定义多数类样本的抽样权重,将存在“近邻簇”的多数类球簇划分为“易误分区域”和“难误分区域”,并提高“易误分区域”内样本的抽样权重;其次,在初次迭代过程中按照抽样权重对多数类样本进行欠采样,之后每轮迭代中按样本分布权重对多数类样本进行欠采样,并把欠采样后的多数类样本与少数类样本组成临时训练集并训练弱分类器;最后,结合样本的密度峰值信息与类别分布为所有样本定义不同的误分代价,并通过代价调整函数增加高误分代价样本的权重。在10个KEEL数据集上的实验结果表明,与现有自适应增强(AdaBoost)、代价敏感自适应增强(AdaCost)、随机欠采样增强(RUSBoost)和代价敏感欠采样自适应增强(USCBoost)等不平衡数据分类算法相比,DPBCPUSBoost在准确率(Accuracy)、F1分数(F1-Score)、几何均值(G-mean)和受试者工作特征(ROC)曲线下的面积(AUC)指标上获得最高性能的数据集数量均多于对比算法。实验结果验证了DPBCPUSBoost中样本误分代价和抽样权重定义的有效性。 相似文献
12.
目的 对图像纹理区域的细节保持一直以来是图像插值技术的一个难题,为此提出了一种梯度优化的有理函数图像插值算法。方法 首先,构造了一种新的含有可调参数的双变量有理插值函数,随着参数的不同取值,该函数具有不同的表达形式,它是多项式模型和有理模型的有机统一体;其次,根据图像的区域特征,利用等值线方法将图像自适应地划分为纹理区域和平滑区域,纹理区域采用有理模型插值,平滑区域采用多项式模型插值;最后,根据各向同性Sobel算子计算插值单元的图像梯度,确定纹理方向,不同纹理方向的插值单元用相应的权重对中心点进行优化。结果 从客观数据、主观效果、时间复杂度3个方面对重建图像进行评价,客观数据包括峰值信噪比(PSNR)和结构相似性(SSIM),从实验结果可以看出,本文算法的PSNR平均提高了0.14~1.50 dB,SSIM平均提高了0.005~0.097。从主观效果来看,本文算法的重建图像的纹理细节更加丰富,边缘结构更加清晰,从时间复杂度来看,本文算法的平均运行时间是3.77 s,分别比DFDF(directional filtering and data fusion)、NEDI(new edge-directed interpolation)、RSAI(robust soft-decision adaptive interpolation)、Lee''s、NARM(nonlocal autoregressive model)算法快了3.28倍、5.26倍、53.28倍、43.53倍、418.54倍。特别地,对于Baboon、Barbara、Metal这类纹理细节丰富的图像,本文算法在峰值信噪比和结构相似性上较对比算法有突出优势,主观效果有明显提高。结论 基于构造的双变量有理插值模型,本文提出了一个梯度优化的有理函数图像插值算法,实验结果表明,该算法在图像纹理细节和边缘结构保持方面具有良好的视觉效果,有效提高了插值图像质量,且时间复杂度较低。 相似文献
13.
针对带有线性等式和不等式约束的无确定函数形式的约束优化问题,提出一种利用梯度投影法与遗传算法、同时扰动随机逼近等随机算法相结合的优化方法。该方法利用遗传算法进行全局搜索,利用同时扰动随机逼近算法进行局部搜索,算法在每次进化时根据线性约束计算父个体处的梯度投影方向,以产生新个体,从而能够严格保证新个体满足全部约束条件。将上述约束优化算法应用于典型约束优化问题,其仿真结果表明了所提出算法的可行性和收敛性。 相似文献
14.
针对细菌觅食算法在优化过程中环境感知能力较弱且容易陷入局部极值的缺陷,将梯度粒子群算法的基本思想引入细菌觅食算法中,改进原算法的收敛速度和收敛能力,并据此提出了基于梯度粒子群算法的细菌觅食算法GPSO-BFA。该算法既利用了细菌觅食算法出色的全局搜索能力,又借助梯度粒子群算法的快速局部寻优能力,很好地将两者的优势结合在一起。基于六个高维Benchmark函数的实验结果显示,该算法在收敛速度和精度方面都优于其他四种细菌觅食算法。 相似文献
15.
在微粒群优化算法PSO中引入梯度算法,提出了一种新型的混合微粒群优化算法——GPSO。该混合优化算法是对PSO每一次进化后的所有微粒进一步执行梯度法寻优操作,并以寻找到的更优个体替代当前个体参与群体的下一代进化。GPSO既利用了PSO出色的全局搜索能力,又借助梯度法的快速局部寻优能力,很好地将两者的优势结合在一起。数值实验表明:无论是对于低维的多峰函数,还是高维的多峰和单峰病态函数,GPSO都表现出很强的优化效率、适用性和鲁棒性。 相似文献
16.
17.
18.
19.
在Web集群中优化分布海量级的Web文档是一个急需解决的问题.提出了一种以减少系统平均响应时间为目的的Web集群文档优化分布方案.该方案合适地拷贝网页簇,并通过对服务器进行建模将网页簇的分布问题转化为0-1整数规划问题.针对该问题的特点,设计实现了一种基于蚁群算法的求解方案,算法中蚂蚁对路径的选择分两步进行,并设置合适的启发值以加快收敛速度.实验结果表明了应用蚁群算法求解Web集群文档优化分布问题的可行性与有效性. 相似文献