首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
近年来,机器学习不断取得显著性进展并被成功应用于诸多领域,然而很多学习模型或算法高度依赖数据的标签质量。实际应用中大量数据集普遍存在复杂的标签噪声,因此机器学习在低质数据建模和标签噪声处理方面面临严峻挑战。文中针对回归中的数值型标签噪声,从理论分析和仿真实验的角度研究了标签估计区间与噪声的关联性,提出了一种极限距离噪声估计方法。在最优样本选择框架下,基于此噪声估计方法提出了一种极限距离噪声过滤(Limit Distance Noise Filtering, LDNF)算法。实验结果表明,所提噪声估计方法与真实标签噪声具有更高的相关性和更低的估计偏差。在标准数据集和真实年龄估计数据集上证实了所提过滤算法可以在不同噪声环境下有效识别标签噪声并减小模型的测试误差,其表现优于最新的其他过滤算法。  相似文献   

2.
研究了几种常用的垃圾邮件过滤算法,分析了这几种方法在邮件过滤应用中各自的优缺点.根据这几种算法的优缺点,对它们进行改良与结合,并增加了通过查看发出的邮件内容进行自动学习的机制;同时针对中英文垃圾邮件采用不同的学习算法,从而建立一个适用中英文环境的垃圾邮件过滤方法.实验表明,该方法的效率和性能达到了较好的水平.  相似文献   

3.
基于内容的文本过滤关键在于建立有效的过滤模板。一种高效的过滤模板可以降低整个文本过滤系统对机器学习机制的要求,提高系统的过滤效率。提出了一种基于概念学习的过滤模板获取方法。该方法结合处理文本特征项的需要改进了概念学习方法中的寻找极大特殊假设算法,并应用新的算法从给定的少量训练文本中提取用户过滤模板。实验结果表明,与直接使用主题描述作为过滤模板的方法相比,较大地提高了过滤精度,可以达到比较令人满意的过滤效果。  相似文献   

4.
本文阐述了基于内容的推荐算法、协同过滤推荐算法,分析这两种推荐算法的优缺点,提出一种基于这两种推荐方法的个性化推荐算法,能同时拥有协同过滤推荐算法和给予内容推荐算法的优点,又能一定程度的避免基于内容或协同过滤推荐算法各自的缺点。将本推荐算法应用到用户在线学习资源系统中,更适合在实际推荐系统中应用。  相似文献   

5.
机器学习算法为很多安全应用提供了良好的解决方案,然而机器学习算法本身却面临被敌手攻击的威胁。为分析敌手攻击对机器学习算法造成的影响,本文提出符合某些特定场合的敌手攻击模型,并在该模型下比较几种线性分类器的对抗性。最后在垃圾邮件过滤公开数据库上进行测试,实验结果表明,支持向量分类器具有相对较好的对抗性。  相似文献   

6.
针对雷达频谱图空间信息较少,且通过单一机器学习算法进行毫米波雷达人体跌倒行为识别精度低、稳定性差的问题,使用人体空间雷达点云时序数据,提出了融合TsFresh特征提取和Stacking堆叠集成学习的跌倒识别方法。首先,采用TI-IWR6843毫米波雷达采集人体动作对应的人体运动跟踪时序数据,构建包含不同年龄、身高、体重信息、跌倒方式的数据集。其次,结合TsFresh时序特征提取工具和基于随机森林模型的特征重要性提取人体跌倒关键时序特征。最后,提出了融合随机森林、支持向量机、K-最邻近算法、XGBoost和CatBoost 5种单元机器学习模型的Stacking堆叠式集成学习方法。结果表明,与典型单一机器学习算法相比,Stacking集成学习算法具有明显的性能提升,能够有效提升人体跌倒行为识别准确性和泛化性。  相似文献   

7.
隐语义模型是一种基于协同过滤的推荐模型,由于其较好的推荐性能已在各个领域广泛应用。近些年机器学习的一个重要研究分支深度学习也在各个领域大放异彩。为进一步提高推荐系统的推荐性能,设计了一种结合隐语义模型和深度学习技术的模型。通过对隐语义模型表示形式的等价转换,可以用深度神经网络表示隐语义模型,提出了基于深度学习的隐语义协同过滤推荐模型。实验结果表明,提出的模型在precision和recall评价指标上明显优于其他协同过滤推荐模型。  相似文献   

8.
王智  王建军  王文东 《计算机科学》2018,45(6):193-196, 215
低秩矩阵修补是机器学习和数据分析中的核心问题,被广泛应用于协同过滤、降维处理、多任务学习和模式识别等领域。针对ADMiRA算法存在收敛速度慢、易陷入局部最优等缺陷,通过在SP算法的每次迭代过程中引入SVP算法,提出一种基于子空间阈值追踪的矩阵修补算法。其利用SVP算法快速收敛的特性,提升了SP算法的收敛速度,且能得到更优的解。仿真实验验证了所提算法的性能。  相似文献   

9.
提出一种快速的图像型垃圾邮件过滤方案,结合半监督机器学习技术改进局部敏感哈希(LSH)算法,基于改进的LSH算法构建垃圾图像特征库索引,提高图像的查找速度。构造了60000个垃圾图像样本,实验结果表明利用改进的LSH算法能有效地提高垃圾图像的过滤速度。  相似文献   

10.
在网络环境下,Web教育资源规模日益庞大,用户申请资源的过程逐渐复杂化。为此,提出一种基于Agent的Web教育资源预选择分层模型。根据预选择分层模型对Web教育资源进行两层过滤,利用基于语义相似度的过滤算法,将Web教育资源根据语义相似度完成匹配筛选;采用用户反馈信息建立机器学习模型,使用基于Q学习的过滤算法筛选Web教育资源。实验结果表明,分层模型可供用户选取符合用户需求的资源,具有较好的可扩展性。  相似文献   

11.
提出了一种基于K近邻(KNN)原理的快速文本分类算法。该算法不仅具有原始K近邻算法分类效果好的优点,还通过对训练样本进行压缩,消除相似度之间的比较,提高了分类效率。实验表明,该算法用于邮件过滤系统时,分类效果要优于基于朴素贝叶斯分类器的二项独立模型和多项式模型,而分类的时间复杂度与其相当,完全可以应用于实时邮件过滤。  相似文献   

12.
近些年,老年人的健康问题越来越受到重视,跌倒作为影响老年人健康安全问题的主要原因之一,其研究热度一直居高不下,高质量的跌倒检测算法层出不穷.总结了跌倒检测的研究意义和现有的热门研究方法,分别从单一算法和混合算法的角度概述基于阈值、机器学习与深度学习三个方面的跌倒检测算法,介绍各算法的检测方式、判定方式、总体性能和各类单...  相似文献   

13.
针对传统的人工监测心脏疾病的方法对资深医生的依赖性强,需要一定的先验知识,且其监测疾病的速度和准确性有待提高等问题,提出了一种基于堆叠分类器的心电(ECG)监测算法来用于心脏异常的判定。首先,将多种机器学习算法的优势相结合,通过叠加分类器的方式集成起来,从而弥补了单个机器学习算法学习的局限性;其次,使用合成少数过采样技术(SMOTE)对原有的数据集进行了数据扩充,使得各种疾病的数量持平从而增强数据的平衡性。通过在MIT-BIH数据集上与其他机器学习算法的结果进行比较评估,实验结果表明所提算法能够提高ECG异常监测的准确性。  相似文献   

14.
决策树算法是经典的分类挖掘算法之一,具有广泛的实际应用价值。经典的ID3决策树算法是内存驻留算法,只能处理小数据集,在面对海量数据集时显得无能为力。为此,对经典ID3决策树生成算法的可并行性进行了深入分析和研究,利用云计算的MapReduce编程技术,提出并实现面向海量数据的ID3决策树并行分类算法。实验结果表明该算法是有效可行的。  相似文献   

15.
蜂窝网络希望能在广泛的应用领域内实现复杂的大范围监测和追踪任务,而移动台节点定位是相关应用的基础。本文在对现有无线网络定位技术研究的基础之上,有针对性地分析当前几种机器学习经典算法,提出了一种基于支持向量机树型多分类的蜂窝通信系统节点定位算法,充当分布式定位的全局坐标算法。通过对算法原理的分析以及实验结果对比,证明了基于机器学习的定位算法在定位效果方面解决了困扰基于信号参数的定位技术的边界问题与集中洞问题,在定位的平均误差、标准偏差和分布式定位正确率以及实现代价几个方面的总体性能均优于基于信号参数的定位技术与GPSone定位技术。  相似文献   

16.
针对现有很多文本分类算法必须进行训练-测试-再训练的缺点以及通用模型的语法表现度较差等问题,提出一种改进的模糊语法算法(IFGA)。首先根据一些选取的文本片段建立学习模型,为了适应轻微变化,采用增量式模型;然后将选取的文本片段转化到底层架构中,即模糊语法。最后利用模糊联合操作将单个文本片段语法进行结合,并将所学习的文本片段转化成更加一般的表示。与决策表算法、朴素贝叶斯等算法进行了两组对比实验,第一个实验结果表明IFGA和其他机器学生算法性能并无明显差异。第二个实验结果说明增量式学习算法比标准机器学习算法更加具有优势。其性能较平稳,数据的尺寸影响更小。另外,提出的算法具有较低的模型重新训练时间。  相似文献   

17.
Real-time and reliable measurements of the effluent quality are essential to improve operating efficiency and reduce energy consumption for the wastewater treatment process.Due to the low accuracy and unstable performance of the traditional effluent quality measurements,we propose a selective ensemble extreme learning machine modeling method to enhance the effluent quality predictions.Extreme learning machine algorithm is inserted into a selective ensemble frame as the component model since it runs much faster and provides better generalization performance than other popular learning algorithms.Ensemble extreme learning machine models overcome variations in different trials of simulations for single model.Selective ensemble based on genetic algorithm is used to further exclude some bad components from all the available ensembles in order to reduce the computation complexity and improve the generalization performance.The proposed method is verified with the data from an industrial wastewater treatment plant,located in Shenyang,China.Experimental results show that the proposed method has relatively stronger generalization and higher accuracy than partial least square,neural network partial least square,single extreme learning machine and ensemble extreme learning machine model.  相似文献   

18.
强化学习作为一种重要的机器学习方法,已经被广泛应用于许多单智能体和多智能体系统。强化学习的性能受所使用的学习算法及其参数的影响很大,不同的学习算法或者参数很小的变化都可能导致学习性能很大的变化。当环境模型未知时,确定最好的算法和最优的参数是困难的。为了避免参数的影响,提出了一种基于多Agent的融合Sarsa(λ)学习系统,它把强化学习环境当作多智能体环境来处理。最后用迷宫实验仿真,结果验证了该方法的可行性和有效性。  相似文献   

19.
基于多智能体的融合Sarsa(λ)学习算法   总被引:1,自引:0,他引:1       下载免费PDF全文
强化学习作为一种重要的机器学习方法,已经被广泛应用于许多单智能体和多智能体系统。强化学习的性能受所使用的学习算法及其参数的影响很大,不同的学习算法或者参数很小的变化都可能导致学习性能很大的变化。当环境模型未知时,确定最好的算法和最优的参数是困难的。为了避免参数的影响,提出了一种基于多Agent的融合Sarsa(λ)学习系统,它把强化学习环境当作多智能体环境来处理。最后用迷宫实验仿真,结果验证了该方法的可行性和有效性。  相似文献   

20.
在光照和目标形变等外部条件变化的情况下,仅利用目标的单一特征难以鲁棒的跟踪目标。提出了一种基于粒子滤波后验概率分布的多特征融合跟踪算法,在粒子滤波跟踪框架下,用直方图模型表征目标的颜色和边缘特征,通过两种特征后验概率之间的"协作"与"学习"实现特征融合,各种场景的试验结果比较表明,新的融合跟踪算法比仅用单一特征跟踪、现有的多特征融合算法具有更好的稳定性和鲁棒性,特别是针对环境光照和目标背景变化较大的情况更具有优势。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号