首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
2.
学生成绩预测是改进教学、提高教学质量的一种重要辅助方法。目前成绩预测研究多数是基于全部训练样本构建预测模型,训练样本没有针对性,未能考虑类内样本的相似性和类间样本的差异性对预测模型的构建和预测效果的影响。因此,为了充分利用类内样本的相似性特性,提出一种基于K-Means的学生成绩预测方法。以某学校汉语言文学和计算机应用两门专业学生的课程成绩为对象,经过大量的实验证明,该方法构建的成绩预测模型具有更高的预测精度,进而可以为改进教学提供更为准确的参考信息,辅助提升学校的教学质量。  相似文献   

3.
本文运用数据挖掘中的决策树分类法,针对大学生的学习态度,建构学习成绩的分类模型,并找出预测低学习成绩或成绩低落的相关决策规则,以提供教师作为教学时的参考。目前针对影响学习成绩的研究,大多着重在分析课程设计、教学模式、学生家庭环境等外在因素的影响,鲜少有针对学生个人的学习态度进行分析。然而学习态度是学生在学习活动的历程中,指示学习行为的方向,因此若所持的评价为正面,则对于所学的课程将全力以赴,所以本文的研究具有很好的现实意义。  相似文献   

4.
5.
本文运用大数据建模技术,选取塔里木盆地顺北油田生产井相关数据,使用线性回归、随机森林、XGBoost三种方法,利用VSAI大数据分析平台来预测单井井筒压力梯度和温度梯度,并与其测压数据实际值相比较.结果表明,随机森林模型和xgboost模型能够较准确的预测压力梯度和温度梯度的趋势变化,与xgboost模型相比,随机森林...  相似文献   

6.
王铮  任华  方燕萍 《电信科学》2016,32(12):7-12
电信运营商有大量数据,但是鉴于多种原因,数据的质量不够理想,出现大量数据不完整甚至缺失。对于已有数据的挖掘,必须在数据满足质量要求且达到足够采样比例的前提下开展。依托现有的全国日志留存系统,设计完整数据的模板样库,鉴别不能满足质量要求的数据,使用随机森林算法,找到最符合的相同或相关数据,补全数据并提升数据质量;用回溯反馈的方法优化并扩充模板样库。在全国日志留存系统中构建数据补全子系统,实现端到端的数据质量保障和提升,补全并改善历史数据甚至实时数据的质量,最终满足数据处理和挖掘的要求,提升运营商数据质量和价值。  相似文献   

7.
本文基于大规模MDT数据结合机器学习算法,将人工智能技术与网络规划仿真相结合,研究一种符合网络实际环境的无线电波传播模型,实现网络深度覆盖的智能预测。通过将原始MDT数据清洗和去噪得到合理的数据集,搭建全连接神经网络,计算每个接收点与发射机之间的6种关键地理特征向量,并输入神经网络进行训练及网络参数调优,得到指标合理的传播模型。基于网络工参进行单站、多站的仿真验证和外场测试对比,模型泛化性好、鲁棒性高,仿真预测结果合理准确,符合地理环境变化,与外场测试对比效果理想。基于MDT数据训练的智能传播模型能精准地实现网络深度覆盖预测,具有极高的指导意义和应用价值。  相似文献   

8.
万成威  王霞  王猛 《电讯技术》2024,64(2):310-315
硬盘广泛应用于各类信息系统中,其工作状态预测对信息系统的正常运行管理有着重要意义。现有基于SMART(Self Monitoring Analysis and Reporting Technology)属性的机器学习预测算法为保证其通用性,普遍选取部分典型属性作为特征,带来一定的信息丢失。在分析SMART数据特点的基础上,提出数据模式分类后再进行机器学习预测的SMART数据处理方法。实际测试结果表明,经分类处理后,采用简单的机器学习算法即可获得与强分类器接近的性能,同时,该方法可有效简化SMART数据机器学习时的特征选择过程,有效降低算法的资源消耗。  相似文献   

9.
物联网环境产生大量数据,数据隐私保护问题已经成为热点研究领域之一。通过阐述物联网大数据的特点和隐私威胁,分析了现有的数据挖掘隐私保护方法的不足,针对性地提供了一种基于混合高斯分布的数据扰动隐私保护方法。该方法通过生成并公开一组与原始数据独立同分布的新数据的手段来达到对原始数据进行扰动的目的,不仅有效地保护了原始数据隐私,并且保持了原始数据的统计特点,与原始数据上生成的挖掘模型具有相近的准确性。  相似文献   

10.
随着校园信息化建设的不断深入,校园内各应用系统逐渐增多,运用数据挖掘技术可以从海量的数据中提取潜在有用的信息用于分析高校学生的日常行为与成绩方面的相关性。对一卡通系统、图书馆管理系统、教务系统等多维数据进行采集,基于密度聚类算法,在初始聚类中心选择的基础上结合了距离的度量,重新定义核心点、孤立点、边界点等概念,构建一个改进的密度聚类算法进行数据挖掘分析,达到对学生学习成绩的预警,避免出现挂科、留级等严重的学业问题。  相似文献   

11.
汽车零部件的齿轮装配过程中往往伴随着多种类型的故障,快速且精准地判断故障类型,对保证齿轮装配工位稳定运行具有重要意义。因此,提出一种基于SMOTE采样方法和随机森林(RF)分类方法的故障诊断模型——SMOTE-RF。首先,在实际齿轮装配过程中,故障数据是不平衡的,可以使用SMOTE算法生成平衡的故障数据;其次,将平衡后的数据作为随机森林算法的输入实现故障分类;最后,对模型进行性能评估。实验结果表明,SMOTE-RF模型的分类效果优于SVM和XGBoost。  相似文献   

12.
13.
介绍了缺失数据属性值的一些处理方法,给出了一种新的基于主曲线的缺失数据属性值的恢复方法,详细地描述了利用该方法对缺失属性值进行恢复的步骤,这种方法能根据数据的特性对缺失属性值进行预测,处理的问题带有一般性,并用具体实验数据验证实验该方法的有效性,通过和其他方法进行比较验证了它的精确性.  相似文献   

14.
15.
数据驱动的软件缺陷预测研究综述   总被引:1,自引:0,他引:1       下载免费PDF全文
李勇  黄志球  王勇  房丙午 《电子学报》2017,45(4):982-988
数据驱动的软件缺陷预测是提高软件测试效率、保证软件可靠性的重要途径之一,近几年已成为实证软件工程的研究热点.首先介绍了数据驱动软件缺陷预测的研究背景;然后总结了已有软件缺陷数据属性度量方法的特点,并按照软件开发中缺陷预测的使用场景,以数据来源为主线从基于版本内数据、跨版本数据和跨项目数据实现缺陷预测三个方面对近10年(2005~2015)已有的研究工作进行分类归纳和比较;最后对该领域未来的研究趋势进行了展望.  相似文献   

16.
郑洁 《无线互联科技》2018,(20):105-106
随着信息技术的迅速发展,数据信息处理技术已经从原始的文件处理演变到复杂且功能强大的数据库系统,为了将这些数据信息转换成有用的知识信息,数据挖掘技术应运而生。数据集的数据质量低下会导致挖掘出的数据准确率明显降低,数据缺失是数据质量低下最常见的情况,为了提升数据质量,对缺失数据的修复问题是一项值得关注的热点问题。文章对缺失数据的修复主要是讨论连续型属性的数据类型,修复方法采用归因技术的思想,利用属性间的关系,用数据集中的现有值去估计那些相关的缺失值。并对比一种常用且高效的缺失值修复方法,在此基础上通过引入属性的特征权值,加强重要属性对数据修复计算的影响,进一步提高了数据修复的准确率。  相似文献   

17.
随着电磁信号环境日趋复杂以及通信设备数量的不断增加,电磁信号受到干扰问题逐渐加剧。因此,对于信号在不同噪声环境下的接收与处理技术的研究以及在复杂的电磁环境中对信号各项数据指标及其携带信息的利用十分关键。为了解在不同电磁环境下含噪信号的性能表现,提高信号的利用质量及可靠性,本文提出一种基于时间序列分解的电磁数据处理方法。建立了基于加法季节性时间序列分解的含噪信号处理模型,并利用该模型对信号在有噪环境下的表现与规律性、趋势、误码率等性能进行分析与评估,对原始信息、载波信息进行挖掘预测。与传统方法相比,本文提出的基于时间序列分解的信号挖掘与预测模型在高噪环境下对信号预测更为准确。  相似文献   

18.
肝癌术后的早期复发率极高,然而肝癌术后症状不明显,传统医学手段判断肝癌是否早期复发的准确率并不理想.针对这一问题,本文选取医院就诊病人信息作为数据对象,采用数据挖掘技术,探究机器学习方法对肝癌早期复发的疾病预测应用效果,以及肝癌早期复发的最优阈值.首先对病人信息数据进行数据清洗等数据预处理操作,运用多个特征工程方法增加预测的精准性.将逻辑回归、随机森林、SVM支持向量机以及GBDT梯度提升树4种模型进行比较,最终选择GBDT梯度提升树建立预测模型.选择准确率、精确率、召回率和AUC 4个指标对所建立的模型进行评估,并得出了肝癌早期复发的最优阈值,为医学领域的相关研究与临床应用提供了一定的参考.  相似文献   

19.
针对电力物联网中电能数据量过多,缺失电能数据修复难度较大的问题,研究基于DA多重插补法和电力物联网的电能数据缺失修复方法。电力物联网利用感知层的电能数据采集终端采集电能数据,所采集电能数据利用通信层传送至应用层,应用层的电能数据缺失修复模块,利用EM插补算法计算电能数据缺失值的初始插补值;将所获取的电能数据插补值作为DA多重插补法的初始值,DA多重插补法利用局部加权回归模型,通过调整电能数据缺失值的预测误差,获取最终电能数据缺失修复结果。实验结果表明,该方法修复电力物联网电能数据的观测误差方差低于0.2,对于短期电能数据与长期电能数据,均具有良好的修复结果。  相似文献   

20.
以数据为基础的知识规则研究已经成为当前高校改进教学手段和提高教学质量的重要方法。文章进行了课程关联度、学生成绩预测两个方面研究。在课程关联方面,文章通过基于数学中的距离计算方法,分别研究了欧几里德距离关联分析算法、相关系数关联分析算法、余弦关联分析算法在课程关联度中的应用,并对三种关联算法进行了对比,其中余弦关联分析算法的效果最好。在学生成绩预测方面,通过调查问卷,收集了大量的数据,通过决策树算法分析了课程理解程度、学习时间、课程兴趣、性别等信息对学生成绩的影响。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号