首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
李延超  肖甫  陈志  李博 《软件学报》2020,31(12):3808-3822
主动学习从大量无标记样本中挑选样本交给专家标记.现有的批抽样主动学习算法主要受3个限制:(1)一些主动学习方法基于单选择准则或对数据、模型设定假设,这类方法很难找到既有不确定性又有代表性的未标记样本;(2)现有批抽样主动学习方法的性能很大程度上依赖于样本之间相似性度量的准确性,例如预定义函数或差异性衡量;(3)噪声标签问题一直影响批抽样主动学习算法的性能.提出一种基于深度学习批抽样的主动学习方法.通过深度神经网络生成标记和未标记样本的学习表示和采用标签循环模式,使得标记样本与未标记样本建立联系,再回到相同标签的标记样本.这样同时考虑了样本的不确定性和代表性,并且算法对噪声标签具有鲁棒性.在提出的批抽样主动学习方法中,算法使用的子模块函数确保选择的样本集合具有多样性.此外,自适应参数的优化,使得主动学习算法可以自动平衡样本的不确定性和代表性.将提出的主动学习方法应用到半监督分类和半监督聚类中,实验结果表明,所提出的主动学习方法的性能优于现有的一些先进的方法.  相似文献   

2.
一、研究性学习如何定位目前教育界对研究性学习内涵的认识已经基本趋于一致:研究性学习又称探究性学习,是由英文单词“InquiryLearning”翻译而来,是人们在总结发现式学习和有意义学习的经验基础上提出的一种以学生自主探究为主的学习方式。研究性学习有广义和狭义之分。从广义上理解,它泛指学生探究问题的学习,是一种学习方式、一种教育理念或策略。显然,它可以渗透于学科教学的过程中。从狭义上理解,它是一种专题研究活动,是指学生在教师指导下,从自身生活和社会生活中选择并确定研究专题,以类似科学研究的方式主动地获取知识、应用知识…  相似文献   

3.
自主学习是大学英语教学一种新的教学模式,强调学生对知识的主动探索、主动发现和主动建构.结合沈阳农业大学的英语教学改革的实践,介绍了大学英语网络教学平台下自主学习模式的特点.实践证明,网络平台下大学英语自主学习模式注重自主学习的理念,重视语言交际能力的培养;提供多样化的教学手段,创造了开放式的英语学习环境;整合了优秀的教学资源,改变以教师为主体的传统教学模式;克服了学生的心理障碍,提供了个性化学习的条件.网络教学平台下自主学习模式充分发挥了个性化自主学习的优势,增强学生自主学习的兴趣,通过教师精心组织教学,保证了教学质量,最终提高学生语言交际能力和英语学习成绩.  相似文献   

4.
主动学习研究综述   总被引:7,自引:0,他引:7  
近年来,主动学习成为机器学习领域的研究热点.这一技术通过主动选择要学习的样例从而有效地降低学习算法的样本复杂度.介绍当前主动学习的研究进展,包括主动学习的样本复杂度,样例选择算法和实际应用,最后指出主动学习领域中还保留的开放问题.  相似文献   

5.
音乐的体验性学习是指教师通过给学生创造一个感受音乐,表现音乐,创造音乐的和谐音乐学习情景,让学生主动地参与到音乐实践活动之中,并在音乐活动体验中获得充分直接或间接的基本的音乐知识、技能技巧、音乐审美体验、享受和成功的欢愉,并提高学生的音乐鉴赏能力和表现能力。那么,我们如  相似文献   

6.
半监督学习是人工智能领域一个重要的研究内容;在半监督学习中,如何有效利用未标记样本来提高分类器的泛化性能,是机器学习研究的热点和难点;主动学习可解决未标记样本有效利用的问题,将主动学习引入到半监督分类中,并改进贝叶斯算法,提出了一种基于改进贝叶斯算法的主动学习与半监督学习结合算法;实验结果表明,该方法取得了较好的分类效果。  相似文献   

7.
图像检索中的主动学习及其可测量性   总被引:1,自引:0,他引:1  
主动学习对于复杂、主观、使用少量训练实例的图像检索查询具有非常有效的作用。在图像检索中应用主动学习与支持向量机相结合的方法进行相关反馈,通过两者的互补来有效地提高图像检索的精度。对比了推理算法、简单主动算法以及角度多样性算法3种主动学习算法,并研究了最好的样本选择策略。还讨论了主动学习中概念复杂度的可测量性,并对未来的研究方向提出了建议。相信随着这些可测量性问题被重点提出,主动学习的成果可以被广泛应用。  相似文献   

8.
图像检索中的主动学习及其可测量性   总被引:1,自引:0,他引:1  
主动学习对于复杂、主观、使用少量训练实例的图像检索查询具有非常有效的作用。在图像检索中应用主动学习与支持向量机相结合的方法进行相关反馈,通过两者的互补来有效地提高图像检索的精度。对比了推理算法、简单主动算法以及角度多样性算法3种主动学习算法,并研究了最好的样本选择策略。还讨论了主动学习中概念复杂度的可测量性,并对未来的研究方向提出了建议。相信随着这些可测量性问题被重点提出,主动学习的成果可以被广泛应用。  相似文献   

9.
近年来,建构主义学习理论引起了人们的广泛关注并成为教育理论界的一个研究热点。其核心观点"自主学习,主动建构"一方面与以人为本的教育理念相吻合,另一方面又与信息化的教育环境密不可分。它为学生的学习实践活动带来了诸多启示:知识的获得并不能简单由教师传授得到,而是要依靠学习者自己借助外部的学习环境主动建构和创新;自主创新学习是当今大学生必须具备的学习能力。  相似文献   

10.
该文依据关系判断任务特点将主动学习应用到本体概念关系的辅助判断中,对边缘采样、熵采样、最不确信采样等主动学习查询生成策略进行了比较研究。在此基础上,从实际应用角度出发,讨论了在三种不同样本初始情况下主动学习技术的应用。对于初始样本正反例充足的情况,采用基于熵采样和边缘采样产生查询;对于初始样本仅有正例的情况,依据样本相似度主动的学习策略生成候选反例;对于缺乏初始样本的情况,使用概念在样本间距离等统计信息,同时生成候选正例和候选反例。从而,实现了在概念关系判定过程中对用户反馈信息的有效利用。  相似文献   

11.
小学生的主动学习集中表现在学习中的主动探究。信息技术教学的主动学习要把自主探究作为培养学生创新能力的着眼点,构建小学自主探究型的课堂教学模式。文章探讨了小学信息技术教学中开展自主探究学习的原则,并例谈了提高课堂学习效益、优化教学进程、培养学生创新和实践能力的途径和方法。  相似文献   

12.
主动学习是一种机器学习方法,需要选择最有价值的样本进行标注。目前,主动学习在应用时面临着一些挑战,其依赖分类器的先验假设,这容易导致分类器性能意外下降,同时需要一定规模的样本作为启动条件。聚类可以降低问题规模,是主动学习的一种有效手段。为此,结合密度聚类边界采样,开展主动学习方法的研究。针对容易产生分类错误的聚类边界区域,通过计算样本密度,提出一种密度峰值聚类边界点采样方法;在此基础上,给出密度熵的定义,并利用密度熵对聚类边界区域进行启发式搜索,提出一种基于聚类边界采样的主动学习方法。试验结果表明,与文献中的5种主动学习算法相比,该算法能够以更少标记量获得同等甚至更高的分类性能,是一种有效的主动学习算法;在标记不足,无标签样本总量20%的情况下,算法在Accuracy、F-score等指标上取得较好的结果。  相似文献   

13.
主动学习算法综述   总被引:1,自引:0,他引:1  
主动学习算法作为构造有效训练集的方法,其目标是通过迭代抽样,寻找有利于提升分类效果的样本,进而减少分类训练集的大小,在有限的时间和资源的前提下,提高分类算法的效率。主动学习已成为模式识别、机器学习和数据挖掘领域的研究热点问题。介绍了主动学习的基本思想,一些最新研究成果及其算法分析,并提出和分析了有待进一步研究的问题。  相似文献   

14.
基于SVM主动学习的入侵检测系统   总被引:2,自引:1,他引:1       下载免费PDF全文
研究在入侵检测中,采用基于支持向量机(SVM)的主动学习算法,解决小样本下的机器学习问题。该文提出了基于SVM主动学习算法的系统框架及适用于入侵检测系统的SVM主动学习算法,讨论了候选样本集的组成比例、候选样本集数量及核函数的不同参数选取对检测结果的影响。通过实验验证,基于SVM主动学习算法与传统SVM算法相比,能有效地减少学习样本数,提高检测精度。  相似文献   

15.
基于采样策略的主动学习算法研究进展   总被引:2,自引:0,他引:2  
主动学习算法通过选择信息含量大的未标记样例交由专家进行标记,多次循环使分类器的正确率逐步提高,进而在标记总代价最小的情况下获得分类器的强泛化能力,这一技术引起了国内外研究人员的关注.侧重从采样策略的角度,详细介绍了主动学习中学习引擎和采样引擎的工作过程,总结了主动学习算法的理论研究成果,详细评述了主动学习的研究现状和发展动态.首先,针对采样策略选择样例的不同方式将主动学习算法划分为不同类型,进而,对基于不同采样策略的主动学习算法进行了深入地分析和比较,讨论了各种算法适用的应用领域及其优缺点.最后指出了存在的开放性问题和进一步的研究方向.  相似文献   

16.
翟俊海  张素芳  王聪  沈矗  刘晓萌 《计算机应用》2018,38(10):2759-2763
针对传统的主动学习算法只能处理中小型数据集的问题,提出一种基于MapReduce的大数据主动学习算法。首先,在有类别标签的初始训练集上,用极限学习机(ELM)算法训练一个分类器,并将其输出用软最大化函数变换为一个后验概率分布。然后,将无类别标签的大数据集划分为l个子集,并部署到l个云计算节点上。在每一个节点,用训练出的分类器并行地计算各个子集中样例的信息熵,并选择信息熵大的前q个样例进行类别标注,将标注类别的l×q个样例添加到有类别标签的训练集中。重复以上步骤直到满足预定义的停止条件。在Artificial、Skin、Statlog和Poker 4个数据集上与基于ELM的主动学习算法进行了比较,结果显示,所提算法在4个数据集上均能完成主动样例选择,而基于ELM的主动学习算法只在规模最小的数据集上能完成主动样例选择。实验结果表明,所提算法优于基于极限学习机的主动学习算法。  相似文献   

17.
本文提出了一种个性化垃圾邮件过滤方法,它能够根据用户反馈自动学习出用户兴趣,并随时间的推移自动适应用户兴趣的变化。该方法首先抽取邮件的语言特征和行为特征构建多个基于规则的单独过滤器,然后采用SVM集成学习方法组合这些单独过滤器的结果。为了提高学习速度、减少用户提供反馈的数量,本文采用了主动学习方法挑选更加富含知识的邮件请求用户给出反馈。实验结果表明:集成学习和主动学习相结合的个性化过滤方法在个性化程度、分类准确率、过滤速度以及自动学习能力等方面具有更好的性能。  相似文献   

18.
学习控制技术·方法应用的发展新动向   总被引:2,自引:0,他引:2  
分析和概述了当前学习控制系统所采用的技术、学习方法及应用的发展新动向 .从所采用的技术来看 ,学习控制正在从采用单一的技术向采用混合技术的方向发展 ;从学习方法和应用来看 ,学习控制正在从采用较为简单的参数学习向采用较为复杂的结构学习、环境学习和复杂对象学习的方向发展  相似文献   

19.
针对海冰遥感图像分类问题中标签样本获取困难、标注成本较高导致海冰分类精度难以提高的问题,提出了一种主动学习与半监督学习相结合的方式用于海冰分类。首先,利用基于不确定性准则和多样性准则进行主动学习方法,选择一批最具信息量的标签样本建立标签样本集;其次,充分利用大量的未标签样本信息,并融合主动学习采样的思想选出部分具有代表性且分布在支持向量周边的半标签样本,建立半监督分类模型;最后,将主动学习方法和直推式支持向量机相结合构建分类模型实现海冰图像分类。实验结果表明,相对于其他方法,该方法在只有少量标签样本的情况下,可以获得更高的分类精度,该方式可有效解决遥感海冰分类问题。  相似文献   

20.
训练语料的标注成本是资源稀缺语言处理研究面临的一个重要问题,通过主动学习(active learning)方法可以选择信息量大、无冗余的语料供人工标注,进而大大降低语料标注成本。该文基于CRF模型给出的标注置信度提出了四种主动学习方法,并通过实验确定了这四种主动学习方法的相关参数。实验显示:选择置信度低于0.7的语料进行人工标注,直到新旧模型标注结果的差异度小于0.01%时,仅需6轮迭代;人工标注3.2MB的语料,藏文人名识别的F值可以达到88%,若要达到该识别效果,基于CRF的监督式学习模型需要标注约10MB的语料,该主动学习方法降低了约66%的语料标注规模。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号