首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
《Planning》2015,(27)
实现垃圾网页的有效检测可以有效提高搜索引擎检索质量,促使网页的设计向着面向用户的方向发展。由于垃圾网页是面向搜索引擎设计的,正常网页是面向用户设计的,因而两者在特征方面存在众多区别,通过机器学习方法可以根据垃圾网页与正常网页在特征方面的不同对垃圾网页进行有效识别。通过对常见单分类器和集成学习分类器处理垃圾网页数据集的对比实验,发现集成学习方法 logitboost较为突出,所得结果明显优于单一分类器和常用集成学习算法,所得结果也更接近真实值,并通过对logitboost所用的预处理方法和基分类器进行改进,发现用resample对垃圾网页进行预处理,以REPTree算法为基分类器的logitboost算法对垃圾网页数据集的分类有较高的精确度。  相似文献   

2.
《Planning》2016,(5)
针对原有岩性分类方法精度较低、泛化能力不足、结果较不稳定以及不符合地质情况的事实,提出基于谱聚类-Adaboost集成算法的数据挖掘技术,应用谱聚类算法对噪音数据不敏感及可收敛到全局最优解的特点,解决样本数据过滤的问题,有效去除数据冗余;依据数据挖掘集成思想中的Adaboost集成算法对基分类器C4.5进行集成优化,将弱分类器提升为强分类器,提升分类能力。通过对某地区498块致密砂岩岩样资料进行处理,结果表明:谱聚类方法的样本筛选能力较交会图方法与经典聚类方法更强;而Adaboost集成算法不仅精度较BP神经网络等经典分类算法高,而且具有着较强的泛化能力,较好地解决了基分类器存在的稳定性弱、泛化能力差等问题;利用谱聚类去除样本冗余-Adaboost集成算法判别的思想使得算法的稳定性更高,岩性判别率稳定到81.96%,明显高于其他判别方法;该方法思路新颖,效果较好,可以进行推广。  相似文献   

3.
《Planning》2020,(6)
针对网络中"疫情相关"数据流主题多样性衍生及交叉变化快,使舆情在线监测尤其是主题可信度分析和真伪监测对算法时空复杂度要求较高,传统线下全文本数据块的离线分析模型很难适用的问题,提出了一种基于集成分类器的在线异常/主题可信监测(online abnormal monitor,OAM)模型。首先按照时间窗口构建单元可信分类器;然后利用集成索引算法将单元可信分类器进行在线高效融合;最后以流查询的模式完成在线异常监测。在中国信息安全测评中心的社交文本数据集上进行的对比实验结果表明,在加载相同分类器的情况下,OAM算法与其他亚线性算法相比,预测时间最多可减少19%。  相似文献   

4.
《Planning》2015,(24)
分类器集成技术已成为机器学习和数据挖掘等领域的一个研究热点。随着时代的进步和科学技术的不断发展,在应用领域中人们对分类技术有了更高的要求。分类器动态集成技术作为一种改进的有效技术以满足人们深层次的需求。本文首先介绍分类器集成的背景、框架和单分类器的集成方式,在此基础上引入多分类器动态集成技术的原理、方法,最后阐述分类器动态集成技术在应用中存在的一些不足之处。  相似文献   

5.
《Planning》2015,(33)
本文提出的基于集成分类器的流量识别技术,由针对不同网络应用的基分类器构成,不同基分类器的判断汇总到决策模块输出最终结果,具有良好的可扩展性,便于增添针对新应用的识别模块;在每个基分类器内部,网络流量首先经过聚类形成若干个簇,在每个簇上单独训练一个分类器,分类器专注于学习簇内部的分类边界;通过增加聚类数量,可以提高集成分类的识别准确率。经实验表明,该技术可以提高单一分类方法的准确性。  相似文献   

6.
《Planning》2019,(2)
在现如今的机器学习领域,集成学习方法作为一种提高模型性能的策略,被广泛应用在各种机器学习模型当中。集成学习的核心概念是综合多个分类器的结果,通过某种集成策略,来得到一个准确率更高的模型。本文依据具体实例"Fashion-MINIST服饰分类数据集",分别采用了kNN模型,logistic模型,以及bagging集成kNN,lo-gistic模型,比较分析了不同模型在该数据集上的差异性以及优缺点。  相似文献   

7.
《Planning》2020,(3):27-32
目前抑郁症的诊断手段单一、诊断率低,为此,文章提出一种基于词向量的SVM集成学习社交网络抑郁倾向检测方法。人工标注和专家校验获得训练数据,使用词向量进行文本向量化。以SVM为基分类器进行Boosting集成学习。实验结果表明,文章提出的模型可以用于抑郁倾向的检测。  相似文献   

8.
《Planning》2018,(6)
基于随机森林算法能够对阿尔茨海默病患病的情况进行分析。通过去除常量、基于有监督学习的特征选择及相关数据检测,对人体各项指标的数据进行合理的降维处理。创建基于随机森林的分类器,将其应用于阿尔茨海默病患病分析,利用降维后有效的特征属性得到的结果可以反应患病情况和诊断状况。  相似文献   

9.
《Planning》2016,(4)
随着互联网的快速发展,文本信息量巨大,大规模的文本处理已经成为一个挑战。文本处理的一个重要技术便是分类,基于SVM的传统文本分类算法已经无法满足快速的文本增长分类。于是如何利用过时的历史文本数据(源任务数据)进行迁移来帮助新产生文本数据进行分类显得异常重要。文章提出了基于半监督的SVM迁移学习算法(Semi-supervised TL_SVM)来对文本进行分类。首先,在半监督SVM的模型中引入迁移学习,构建分类模型。其次,采用交互迭代的方法对目标方程求解,最终得到面向目标领域的分类器。实验验证了基于半监督的SVM迁移学习分类器具有比传统分类器更高的精确度。  相似文献   

10.
BP神经网络在工程机械液压系统故障诊断中的应用研究   总被引:1,自引:0,他引:1  
将BP神经网络理论应用于工程机械液压系统故障诊断中进行研究,通过系统数据的采集、特征向量的提取和分类器的构造,在对网络进行训练的基础上,建立了学习算法,通过试验可以看出神经网络能给出的满意结果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号