首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
学校做好学生健康管理,及时发现身体素质不好的、容易生病的学生,并提前做好干预工作,具有重要的现实意义和应用价值。在调研采集学生体质数据集的基础上,采用Python机器学习库Sklearn库对学生体质分类进行挖掘建模,对学生易生病体质进行挖掘分类,同时将模型部署到Web系统中,实现了学生体质在线预测功能,能辅助学校进行学生健康管理决策。  相似文献   

2.
神经网络系统支持下的机器学习,依托于网络算法、模糊理论、智能技术等,可真正实现数据整合,提高机器系统的记忆性能.基于此,以神经网络系统运行原理为切入点,阐述和探讨了机器学习模式,对神经网络的机器学习结构优化方式及其具体应用.  相似文献   

3.
软件产品线可变性建模技术系统综述   总被引:4,自引:1,他引:3  
聂坤明  张莉  樊志强 《软件学报》2013,24(9):2001-2019
软件产品线是实现大规模的软件复用、保证高质量的新产品开发的最佳实践.软件产品线的关键问题是如何进行可变性管理,并基于可变性管理实现软件核心资产的复用.软件产品线可变性建模是可变性管理的关键技术,实现产品家族成员的共性和可变性的描述.可变性建模涉及软件开发的全生命周期,在领域工程和应用工程中,尤其是在产品构建过程中,起到重要的作用.从众多的建模技术中选择合适的建模技术是十分困难的,在软件产品线领域中开展了可变性建模技术的系统综述,按照系统综述的方法对可变性建模技术进行了系统总结,根据系统综述规则,选取了从1990 年~2011 年发表的论文进行综述.讨论了系统综述的研究成果,从可变性建模方法分类、重要可变性建模技术对比等方面进行深入的探讨,为建模人员和研究人员对可变性建模技术的选择和研究提供支持.最后分析了可变性建模技术的研究趋势,并对可变性建模技术有待深入的研究难点和发展趋势进行了展望.  相似文献   

4.
研究了关联规则分类算法,应用关联规则Apriori算法,对远程教育考试系统数据样本进行数据分析,从分析的结果中发现有价值的数据模式,寻找其中存在的关系和规则,可以为教学和考试环节发挥调节、控制、指导作用,为远程教育管理提供合理、科学的决策支持.以分类关联规则挖掘为主线,研究了数据挖掘流程中数据预处理技术、分类关联规则挖掘建模及实施应用等过程的实现.实验结果表明,该分类应用系统实现了对考试数据的自动分类,具有较好的分类运算速度.  相似文献   

5.
基于Spark的流程化机器学习分析方法   总被引:1,自引:0,他引:1  
Spark通过使用内存分布数据集,更加适合负载数据挖掘与机器学习等需要大量迭代的工作.但是数据分析师直接使用Spark进行开发十分复杂,包括scala学习门槛高,代码优化与系统部署需要丰富的经验,同时代码的复用度低导致重复工作繁多.本文设计并实现了一种基于Spark的可视化流程式机器学习的方法,一方面设计组件模型来刻画机器学习的基本步骤,包括数据预处理、特征处理、模型训练及验证评估,另一方面提供可视化的流程建模工具,支持分析者设计机器学习流程,由工具自动翻译为Spark平台代码高效执行.本工具可以极大的提高Spark平台机器学习应用开发的效率.论文介绍了工具的方法理论和关键技术,并通过案例表明工具的有效性.  相似文献   

6.
卫星在研制和应用的各个环节产生了庞大的特征和相关性复杂的遥测数据,人工判读或使用专家策略进行分析均无法充分梳理出这些数据的相关性并进一步挖掘和应用它们的价值;利用Python强大的机器学习生态环境和算法,能够实现对卫星遥测数据的分析和建模;以星载铷钟遥测数据为样本,提出了对卫星遥测数据进行算法分析和建立模型的方法,为实现对铷钟的健康状态进行实时评估、预报、精准控制奠定了基础;除遥测数据外,该方法亦可用于分析卫星其它数据,为卫星研制和应用过程中利用机器学习技术提高智化能水平提供了参考。  相似文献   

7.
深度学习的昨天、今天和明天   总被引:17,自引:0,他引:17  
机器学习是人工智能领域的一个重要学科.自从20世纪80年代以来,机器学习在算法、理论和应用等方面都获得巨大成功.2006年以来,机器学习领域中一个叫“深度学习”的课题开始受到学术界广泛关注,到今天已经成为互联网大数据和人工智能的一个热潮.深度学习通过建立类似于人脑的分层模型结构,对输入数据逐级提取从底层到高层的特征,从而能很好地建立从底层信号到高层语义的映射关系.近年来,谷歌、微软、IBM、百度等拥有大数据的高科技公司相继投入大量资源进行深度学习技术研发,在语音、图像、自然语言、在线广告等领域取得显著进展.从对实际应用的贡献来说,深度学习可能是机器学习领域最近这十年来最成功的研究方向.将对深度学习发展的过去和现在做一个全景式的介绍,并讨论深度学习所面临的挑战,以及将来的可能方向.  相似文献   

8.
许晖  徐鹏 《计算机科学》2005,32(10):16-19
表格作为结构化数据的一种最常用的表现形式,已被各个行业广泛应用在信息管理系统中.表格的自动生成和处理技术也成为应用信息系统设计和实现中的关键技术.随着Internet和Web技术的发展,Web与传统的数据库系统、文档管理系统结合在一起构成了巨大的、异构的、分布式的数据仓库.海量信息和异构信息的处理对表格的数据建模和处理技术提出了新的要求.针对现有技术在表格建模方面存在的模型结构简单,支持的表格类型有限和缺乏对集成异构数据源的支持等缺陷,本文在从设计和实现方面分析现有各种信息系统对表格处理技术的需求基础上,提出了一种面向数据绑定的新型表格建模方法以及相关技术,从而满足数据层和显示层在数据源类型、数据集成和组织方式等方面的多种需求.  相似文献   

9.
荣进国  陈锋 《计算机仿真》2005,22(11):110-113
设施农业要求对营养液离子浓度进行精确实时在线检测;支持向量机(Support Vector Mechine,SVM)方法较之于神经网络等方法,具有更扎实的理论基础与更好的泛化能力,特别适合于小样本建模.将SVM方法应用于营养液离子浓度检测,利用数据融合的理论,不仅可以及时准确地对传感器进行可靠性诊断、实时模型的更新,还可以实现对不可在线检测成分的软测量.仿真结果表明,在营养液离子浓度检测系统中应用SVM方法的数据融合技术,模型简单,执行效果好.  相似文献   

10.
随着人工智能、大数据等技术的发展,数据采集、数据分析等应用日渐普及,隐私泄露问题越来越严重.数据保护技术的缺乏限制了企业之间数据的互通,导致形成"数据孤岛".安全多方计算(securemultiparty computation,MPC)技术能够在不泄露明文的情况下实现多方参与的数据协同计算,实现安全的数据流通,达到数据"可用不可见".隐私保护机器学习是当前MPC技术最典型也是最受关注的应用与研究领域,MPC技术的应用可以保证在不泄露用户数据隐私和服务商模型参数隐私的情况下进行训练和推理.针对MPC及其在隐私保护机器学习领域的应用进行全面的分析与总结,首先介绍了MPC的安全模型和安全目标;梳理MPC基础技术的发展脉络,包括混淆电路、不经意传输、秘密分享和同态加密;并对MPC基础技术的优缺点进行分析,提出不同技术方案的适用场景;进一步对基于MPC技术实现的隐私保护机器学习方案进行了介绍与分析;最后进行总结和展望.  相似文献   

11.
郭威  徐涛  于建江  汤克明 《控制与决策》2017,32(9):1556-1564
针对大规模在线学习问题,提出一种二维分割贯序正则化超限学习机(BP-SRELM).BP-SRELM以在线贯序超限学习机为基础,结合分治策略的思想,从实例和特征两个维度对高维隐层输出矩阵进行分割,以降低问题求解的规模和计算复杂性,从而极大地提高对大规模学习问题的执行效率.同时,BP-SRELM通过融合使用Tikhonov正则化技术进一步增强其在实际应用中的稳定性和泛化能力.实验结果表明,所提出的BP-SRELM不仅具有更高的稳定性和预测精度,而且在学习速度上优势明显,适用于大规模数据流的在线学习与实时建模.  相似文献   

12.
In recent years, the data management and analysis technique supporting Artificial Intelligence (AI) has become one of the hot issues in the field of big data and AI. Using and developing theory and technology of data management and analysis provide a basic support for improving the efficiency and effectiveness of the life cycle of AI systems and will surely further promote the development of AI technology based on big data and its wider application. In particular, AI technology represented by machine learning extracts knowledge by modeling data, and one training process includes multiple sub-processes such as data selection, feature extraction, algorithm selection, hyper-parameter tuning and effect evaluation. After the effect evaluation is obtained at the end of the training, it is usually necessary to manually analyze model effect to mine the relationship of model effect with data, features and algorithms, and the training sub-processes are adjusted and iterated for multiple rounds based on data analysis and artificial experience. Apparently, machine learning tasks are much more complicated than query and analysis tasks of database systems. Due to the large number of training sub-processes and iteration adjustments of machine learning and many sub-processes requiring manual participation, the training process is still task-oriented, and the training sub-process is customized and optimized according to the features of the task. This approach has a high cost of labor participation and cannot reuse resources such as data, features and models between multiple tasks. Therefore, there are problems of high cost, low efficiency and high energy consumption. Then how to reduce the management cost in AI computing processes such as machine learning to improve its intelligent computing efficiency has become a core challenge in this field.  相似文献   

13.
近年来,基于机器学习的数据分析和数据发布技术成为热点研究方向。与传统数据分析技术相比,机器学习的优点是能够精准分析大数据的结构与模式。但是,基于机器学习的数据分析技术的隐私安全问题日益突出,机器学习模型泄漏用户训练集中的隐私信息的事件频频发生,比如成员推断攻击泄漏机器学习中训练的存在与否,成员属性攻击泄漏机器学习模型训练集的隐私属性信息。差分隐私作为传统数据隐私保护的常用技术,正在试图融入机器学习以保护用户隐私安全。然而,对隐私安全、机器学习以及机器学习攻击三种技术的交叉研究较为少见。本文做了以下几个方面的研究:第一,调研分析差分隐私技术的发展历程,包括常见类型的定义、性质以及实现机制等,并举例说明差分隐私的多个实现机制的应用场景。初次之外,还详细讨论了最新的Rényi差分隐私定义和Moment Accountant差分隐私的累加技术。其二,本文详细总结了机器学习领域常见隐私威胁模型定义、隐私安全攻击实例方式以及差分隐私技术对各种隐私安全攻击的抵抗效果。其三,以机器学习较为常见的鉴别模型和生成模型为例,阐述了差分隐私技术如何应用于保护机器学习模型的技术,包括差分隐私的随机梯度扰动(DP-SGD)技术和差分隐私的知识转移(PATE)技术。最后,本文讨论了面向机器学习的差分隐私机制的若干研究方向及问题。  相似文献   

14.
Extreme learning machine (ELM) is widely used in complex industrial problems, especially the online-sequential extreme learning machine (OS-ELM) plays a good role in industrial online modeling. However, OS-ELM requires batch samples to be pre-trained to obtain initial weights, which may reduce the timeliness of samples. This paper proposes a novel model for the online process regression prediction, which is called the Recurrent Extreme Learning Machine (Recurrent-ELM). The nodes between the hidden layers are connected in Recurrent-ELM, thus the input of the hidden layer receives both the information from the current input layer and the previously hidden layer. Moreover, the weights and biases of the proposed model are generated by analysis rather than random. Six regression applications are used to verify the designed Recurrent-ELM, compared with extreme learning machine (ELM), fast learning network (FLN), online sequential extreme learning machine (OS-ELM), and an ensemble of online sequential extreme learning machine (EOS-ELM), the experimental results show that the Recurrent-ELM has better generalization and stability in several samples. In addition, to further test the performance of Recurrent-ELM, we employ it in the combustion modeling of a 330 MW coal-fired boiler compared with FLN, SVR and OS-ELM. The results show that Recurrent-ELM has better accuracy and generalization ability, and the theoretical model has some potential application value in practical application.  相似文献   

15.
一般的在线学习算法对不平衡数据流的分类识别会遇到较大困难,特别是当数据流发生概念漂移时,对其进行分类会变得更困难.文中提出面向不平衡数据流的自适应加权在线超限学习机算法,自动调整实时到达的训练样本的惩罚参数,达到在线学习不平衡数据流的目的.文中算法可以适用于不同偏斜程度的静态数据流的在线学习和发生概念漂移时数据流的在线学习.理论分析和在多个真实数据流上的实验表明文中算法的正确性和有效性.  相似文献   

16.
随着互联网 教育技术的快速发展,慕课已成为当下最新、最潮的学习形式。由于在线学习平台积累了大量学习行为数据,传统统计分析方法已无法满足应用需求,使得数据挖掘技术被引入在线学习行为的研究,从而涌现出大量的研究成果。为了深入分析在线学习行为研究中数据挖掘技术的整体应用情况,本文首先从国内外公认的Web of Science数据库收集2008年至2017年3月相关文献进行了统计和可视化分析;然后介绍了利用数据挖掘技术进行在线学习行为研究的一般流程;接着将数据挖掘技术在在线学习行为研究中的应用总结归纳为五类,并详细介绍了相关研究成果及代表文献;最后总结全文,并讨论了未来可能的研究方向。  相似文献   

17.
近年来,随着深度学习等技术的快速发展和航天器系统数据量的不断增加,新型的机器学习平台凭借其友好的流程化分析框架、丰富的即插即用机器学习工具、分布式的服务等诸多优点,为航天器等领域复杂问题分析处理提出了新思路。在分析了航天器故障预测与健康管理方面存在的难点以及机器学习优势基础上,提出了面向机器学习建模的航天器健康管理平台设计方案与方法,分析了多语言融合的健康管理算法模型构建、基于分布式的健康管理计算服务引擎等关键技术,并以某卫星电源系统太阳电池阵功率预测等案例详细说明平台实际应用情况,验证结果表明研究成果能够为基于机器学习建模的航天器健康管理技术研究与应用提供技术参考,最终提高卫星、空间站等航天器的安全性。  相似文献   

18.
谷洪彬  杨希  魏孔鹏 《计算机时代》2020,(5):109-111,115
针对高校本身业务系统带来的不同结构海量数据的存储管理和高效利用问题,通过比较新兴的数据湖技术和传统的数据仓库的区别,构建了基于数据湖的高校数据管理体系和数据处理机制,为高校的数据治理提供了数据层的存储支持,为使用机器学习方法进行大数据分析提供了非结构化数据来源。  相似文献   

19.
网络学习空间与智慧教育的融合,在一定程度上改变了学生的学习方式和教师的教学方式,更有利于培养学生的自主学习能力和激发他们的学习兴趣,从而达到提升教学质量的目的。文章从真实的教学实践出发,提出了基于大数据分析技术的网络学习空间与智慧课堂融合的整体目标架构,从中分析智了慧课堂教学目标和利用大数据技术分析学生在网络学习空间的学习状况。  相似文献   

20.
面向流数据分类的在线学习综述   总被引:1,自引:0,他引:1  
翟婷婷  高阳  朱俊武 《软件学报》2020,31(4):912-931
流数据分类旨在从连续不断到达的流式数据中增量学习一个从输入变量到类标变量的映射函数,以便对随时到达的测试数据进行准确分类.在线学习范式作为一种增量式的机器学习技术,是流数据分类的有效工具.主要从在线学习的角度对流数据分类算法的研究现状进行综述.具体地,首先介绍在线学习的基本框架和性能评估方法,然后着重介绍在线学习算法在一般流数据上的工作现状,在高维流数据上解决“维度诅咒”问题的工作现状,以及在演化流数据上处理“概念漂移”问题的工作现状,最后讨论高维和演化流数据分类未来仍然存在的挑战和亟待研究的方向.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号