首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 31 毫秒
1.
工业过程数据中缺失值处理方法的研究   总被引:1,自引:0,他引:1  
针对工业生产中过程数据的缺失问题,首次提出了运用多重填补方法处理工业过程的缺失数据.阐述了常用的缺失数据处理方法,指出各方法的优缺点.在此基础上,通过建立回归模型,针对多变量工业数据中缺失值较少和较多时的两种情况,分别用删除含缺失值的个案,简单填补和多重填补(MI)3种方法对数据进行处理,利用处理后的新数据集进行数据挖掘,预测目标变量的值,并对预测结果进行分析比较.实验结果表明,多重填补方法的处理效果最好,为工业数据的缺失值处理提供了有用的策略.  相似文献   

2.
大气污染物浓度数据具有时序性和非线性的特点,针对时间序列数据中的异常值和缺失值问题,进行异常值和缺失值预处理对长短时记忆神经网络(LSTM)预测精度的影响分析.利用箱线图法判别数据序列中的异常值,以均值替换法、回归插补法和多重插补法进行缺失值的预处理,分别利用原始数据序列和不同预处理方法得到的数据序列,对多变量输入LSTM神经网络的大气污染物预测精度进行对比分析.实验结果表明,三种预处理方法均可明显改善LSTM模型的预测精度,多重插补法精度最高.  相似文献   

3.
矿山数据挖掘需要完整的数据,因此必须处理矿山数据中的缺失值.为了解决在矿山经济数据的分析预测时出现的缺失问题,提出用SPSS软件的数据缺失值处理模块对数据缺失机制进行分析,采用平均值法、加权均值法、线性回归法、最大期望法、多重填补法等确定性和随机性方法插补缺失数据,分析了这些方法的优缺点,并对插补结果进行比较,以达到客...  相似文献   

4.
照片的破损和丢失是照片数字化后常见的现象。用以AR模型为基础的预示算子进行修复时,边缘连续性差,最小最大函数插补法可以克服这一问题。论文介绍了一种利用最小最大函数插补法,并引入了共轭梯度法的照片修补算法,达到了较好的效果。  相似文献   

5.
数据预处理方法在移动通信行业中的应用   总被引:1,自引:0,他引:1  
解决数据本身的质量问题,以某移动通信用户离网原因分析及预测为主题及为数据挖掘模型处理出需要的数据是文章的主要目的.文中运用了数据预处理中,维规约,属性集成与构造,多重插补,离散化,规范化,数据抽样等方法来得到一个完整的、近似真实的数据集.针对所处理数据含有大量缺失值的特点,选取了插补的方法进行处理.包括方法的插补方法的选择,到最后使用多重插补方法对缺失数据进行修正.预处理后的数据应用到具体数据挖掘模型后提高了数据挖掘的效率,降低了数据挖掘复杂度.  相似文献   

6.
殷杰  石锐 《计算机应用》2007,27(B06):438-439
采用SAS软件中的多重填补法(MI),期望最大化算法(EM)和AdHoc法分别对医疗费用集的缺失值进行处理,比较三种方法的优劣并探讨其在医疗费用缺失值处理中的适用性。运用SAS9.10,采用数据模拟技术,分别模拟真实医疗数据集的各种缺失率的随机缺失数据集,分别用MI、EM和AdHoc对各缺失数据集进行处理,对结果进行比较和分析。结果:数据缺失率≤10%时,AdHoc更优;数据缺失率在15%~30%时,经MI处理后的分析结果更接近“真实”;数据缺失率≥35%时,三种方法均无效。结论:对不同缺失率的费用科目缺失数据集,MI和AdHoc对缺失值的处理各有优劣,EM效果略差于MI,没有明显优势。  相似文献   

7.
《软件》2016,(9):24-26
Goodgrant基金会是美国的一个慈善组织,它希望通过慈善捐助来提高本科生教育绩效。为了更好的利用这笔资金,需要进行投资策略的研究。首先将所有候选学校用SPSS进行K-均值聚类分析,依据聚类结果分为6类。在相同类别中的学校,用MATLAB中的三角形线性插补法进行缺失数据的填补。然后将13个绩效影响因素归纳为生源质量、学校发展情况、学校及学生财务状况三个一级指标。通过熵值法客观地确定学校绩效评价的权重系数。利用熵值法计算出一级二级指标的权重,进行综合评价。按照评价标准计算出每个学校当前的绩效值,并以此对所有学校进行初步排名。选取排名前十的学校,依据每个学校的绩效值及办学规模确定奖学金金额。  相似文献   

8.
计算机动画关键帧插补技术综述   总被引:1,自引:0,他引:1  
对计算机辅助动画制作过程中关键帧的插补技术进行了研究。线性插值法通过给定的起始帧和结束帧对应点之间的直线距离算出中间插值帧。移动点约束条件插补法利用随时间空间变化的曲线与彩体上的点相关联,来控制关键帧上对应控制点的轨迹以厦动态特征。骨架插补法是将图形抽象成骨架,然后进行插补。  相似文献   

9.
SAS中处理数据集缺失值方法的对比研究   总被引:1,自引:0,他引:1  
采用SAS软件中的多重填补法(MI),期望最大化算法(EM)和Ad Hoc法分别对医疗费用集的缺失值进行处理,比较三种方法的优劣并探讨其在医疗费用缺失值处理中的适用性.运用SAS9.10,采用数据模拟技术,分别模拟真实医疗数据集的各种缺失率的随机缺失数据集,分别用MI、EM和Ad Hoc对各缺失数据集进行处理,对结果进行比较和分析.结果:数据缺失率≤10%时,Ad Hoc更优;数据缺失率在15%~30%时,经MI处理后的分析结果更接近"真实";数据缺失率≥35%时,三种方法均无效.结论:对不同缺失率的费用科目缺失数据集,MI和Ad Hoc对缺失值的处理各有优劣,EM效果略差于MI,没有明显优势.  相似文献   

10.
针对运动控制系统对高速度与高精度的要求,基于二次插补原理及最小偏差插补法,提出一种以PC机为主控制器、FPGA为从控制器的主从式运动控制系统的设计。主控制器的功能是对系统运行过程进行控制规划和粗插补;从控制器的功能是对加工进行精插补和执行速度控制。该系统在Matlab环境下进行了插补仿真,并在两轴数控雕刻床上进行了加工测试,验证了系统的可靠性与高精度。加工精度可达0.01 mm,为高精度、高速插补数控系统提供了有效的解决方案。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号