排序方式: 共有48条查询结果,搜索用时 0 毫秒
1.
随着网络应用服务类型的多样化以及网络流量加密技术的不断发展,加密流量识别已经成为网络安全领域的一个重大挑战。传统的流量识别技术如深度包检测无法有效地识别加密流量,而基于机器学习理论的加密流量识别技术则表现出很好的效果。因此,本文提出一种融合梯度提升决策树算法(GBDT)与逻辑回归(LR)算法的加密流量分类模型,使用贝叶斯优化(BO)算法进行超参数调整,利用与时间相关的流特征对普通加密流量与VPN加密流量进行识别,实现了整体高于90%的流量识别准确度,与其他常用分类模型相比拥有更好的识别效果。 相似文献
2.
近年来,集成学习(Ensemble Learning,EL)分类方法成为土地覆被分类的研究热点,尤其是Boosting集成分类方法具有分类精度高、泛化能力强,在土地覆被分类中得到了显著的应用。但是,Boosting集成分类方法对噪声很敏感,如果训练样本含有噪声时,Boosting算法可能会失效,这是该方法的局限性。为了解决Boosting集成方法在土地覆被分类中存在的问题,有效克服噪声的影响,减少分类结果中的“椒盐”现象和提高分类精度,提出了基于双树复小波分解的Boosting集成学习分类方法。该方法对影像的光谱波段进行一层双树复小波分解,降低图像的噪声,将分解后的各波段作为Boosting集成学习的输入,得到最终的分类结果。实验先后比较了GBDT、XGBoost、LightGBM 3种Boosting集成学习算法在SPOT 6和Sentinel-2A影像上的分类效果。结果表明:(1)在SPOT 6影像上,3种Boosting集成算法总体分类精度均高于90%;DTCWTLightGBM分类总体精度最高,达到94.73%,Kappa系数为0.93,比LightGBM总体精度提高了1.1%... 相似文献
3.
运用数据挖掘技术进行铁路事故类型预测及成因分析, 对于建立铁路事故预警机制具有重要意义. 为此, 本文提出一种基于梯度提升决策树(Grandient boosting decision tree, GBDT)的铁路事故类型预测及成因分析算法. 针对铁路事故记录数据缺失的问题, 提出一种基于属性分布概率的补全算法, 最大程度保持原有数据分布, 从而降低数据缺失对事故类型预测造成的影响. 针对铁路事故记录数据类别失衡的问题, 提出一种集成的GBDT模型, 完成对事故类型的鲁棒性预测. 在此基础上, 根据GBDT预测模型中特征重要度排序, 实现事故成因分析. 通过在开放数据库上进行实验, 验证了本文模型的有效性. 相似文献
4.
5.
位置属性对于线下消费的用户具有重要影响。为了有效提高个性化推荐精度,在对O2O电子商务特点进行用户特征分析的基础上,在推荐算法中引入当前时间参数和位置参数,提出了一种改进的基于梯度提升回归算法的O2O电子商务推荐模型。实验结果表明,改进的基于梯度提升回归算法的O2O电子商务推荐模型在实时性和准确性方面明显优于传统的推荐算法。 相似文献
6.
针对现有方法对锂电池剩余使用寿命(RUL)预测精度不高,模型训练时间较长的问题,提出一种基于梯度提升决策树
算法(GBDT)结合网格搜索法(GS)的预测模型。 首先,分析锂电池的充放电循环过程,确定电压、电流、温度为可用健康因子
(HI);其次,处理历史数据中的异常值,并均值化可用健康因子数据为特征输入;最后,通过 GBDT 算法建立锂电池剩余使用寿
命预测模型,并采用 GS 优化模型参数。 基于 NASA 锂电池容量衰减数据,实验结果表明,模型在 RMSE、MAE、MAPE 评价指标
上相对其他方法均提升了约 10 倍,并且可将锂电池剩余使用寿命预测误差率控制在 0. 05 以内,训练时间缩减至 4. 5 s。 相似文献
7.
Kun Zhu Shi Ying Nana Zhang Rui Wang Yutong Wu Gongjin Lan Xu Wang 《计算机、材料和连续体(英文)》2020,62(3):1161-1185
SaaS software that provides services through cloud platform has been more
widely used nowadays. However, when SaaS software is running, it will suffer from
performance fault due to factors such as the software structural design or complex
environments. It is a major challenge that how to diagnose software quickly and accurately
when the performance fault occurs. For this challenge, we propose a novel performance
fault diagnosis method for SaaS software based on GBDT (Gradient Boosting Decision
Tree) algorithm. In particular, we leverage the monitoring mean to obtain the performance
log and warning log when the SaaS software system runs, and establish the performance
fault type set and determine performance log feature. We also perform performance fault
type annotation for the performance log combined with the analysis result of the warning
log. Moreover, we deal with the incomplete performance log and the type non-equalization
problem by using the mean filling for the same type and combination of SMOTE (Synthetic
Minority Oversampling Technique) and undersampling methods. Finally, we conduct an
empirical study combined with the disaster reduction system deployed on the cloud
platform, and it demonstrates that the proposed method has high efficiency and accuracy
for the performance diagnosis when SaaS software system runs. 相似文献
8.
不平衡分类问题广泛地应用于现实生活中,针对大多数重采样算法侧重于类间平衡,较少关注类内数据分布不平衡问题,提出一种基于聚类的混合采样算法。首先对原始数据集聚类,然后对每一簇样本计算不平衡比,根据不平衡比的大小对该簇样本做出相应处理,最后将平衡后的数据集放入GBDT分类器进行训练。实验表明该算法与几种传统算法相比F1-value和AUC更高,分类效果更好。 相似文献
9.
针对脑机接口研究中的脑电信号特征提取与分类问题,提出了一种基于双树复小波变换结合GBDT的想象左右手运动脑电识别的方法。该方法首先深入研究了双树复小波变换相比于小波包变换在脑电信号特征提取方面的优势并验证了ERD/ERS现象;实验数据采用了2003年国际脑机接口竞赛的标准数据集DataSetⅢ,然后,选取了4个典型的时间段进行实验对比,利用双树复小波变换分解与重构提取运动感知节律相关信号分量的能量均值作为特征进行GBDT分类。最后,实验取得了较好的分类准确度,验证了双树复小波变换结合GBDT的方法在脑电信号识别应用中的有效性。 相似文献
10.
Facing with thousands of online product reviews, consumers usually pay close attention to those valuable ones which provide more specific and credible evaluations on products. Whether a close association exists between product review quality and sales is thus examined in this paper. By employing text mining techniques on multiple review features, a review is measured as one of the following two levels: high-quality or low-quality. In doing so, aggregate quality level of product’s whole reviews is also identified. Then, a two-level econometrical analysis is conducted on the real datasets from Amazon.cn. The results reveal that aggregate quality level of positive reviews and negative reviews interactively influence sales. In the situation the aggregate quality level of positive reviews is high meanwhile that of negative reviews’ is low, product sale is the highest, while in the opposite situation product sale is the lowest. The results also reveal that consumers understand product’s value from weighting positive and negative reviews of high-quality level, which then positively relates to product sales and exerts a dynamic effect on sales by the moderating role of product selling stage and popularity. The paper innovatively integrates the quantitative and qualitative characteristics of reviews to estimate their economic effect. 相似文献