共查询到19条相似文献,搜索用时 203 毫秒
1.
介绍了数据挖掘中不完整数据的研究现状及ICA与SOM的特点,提出了基于ICA与SOM的不完整数据的处理模型IVS-IDH,研究了数据之间存在相关关系且为非高斯分布时不完整数据的处理方法,在SOM基础上取得了不完整数据集的可视化分析结果,从而克服了Wang S提出的不完整数据处理方法的不足。 相似文献
2.
3.
曹旭 《自动化技术与应用》2024,(6):133-136+155
现有人力资源数据缺失值填补方法均方根误差大、填补命中率低等问题。提出一种基于数据挖掘的人力资源数据缺失值填补方法。采用分裂Bregman迭代算法消除人力资源数据中存在的噪声,根据人力资源数据的时间序列特征,挖掘数据中存在的隐藏变量。根据特征对缺失值进行检测。通过FCMSI算法根据缺失值检测结果对缺失值进行填补,采用平均比率法首次填充人力资源数据,通过模糊C均值聚类算法对填充后的数据进行聚类处理,其次在协同过滤思想的基础上进一步对人力资源数据的缺失值进行填补。实验结果表明,所提方法的均方根误差小、填补命中率高。 相似文献
4.
5.
陈光平 《计算机工程与应用》2012,48(12):135-138
时间序列是在如运动捕捉、传感器网络、气候预报和财经市场预测等应用中的重要分析手段之一,然而在许多现实应用中经常发生观察数据缺失现象,如何应用相应的方法和模型来预测和填补含缺失数据的时间序列是目前研究的热点。以运动捕捉中遮挡问题为例提出了改进方法,利用平滑性和相互关联等时间序列数据特性,发现时间序列数据中的隐藏变量并挖掘它们的动态特性,在此基础上预测和填补时间序列的缺失值。实验结果证明了方法具有较小的数据重构误差,方法的计算时间应随着输入和运动捕捉持续时间增大而缓慢增长。 相似文献
6.
实际工业过程具有强非线性非高斯噪声等特点,粒子滤波是一种常用的状态估计方法。带约束粒子滤波通过极大后验概率密度函数原则,将超出约束区域的状态估计值映射到约束区域,保证了状态估计的有效性。本文针对检测值部分缺失和全部缺失两种情况,提出一种缺失数据下的带约束粒子滤波算法。该算法基于贝叶斯原理,分别从先验粒子权值的计算以及状态估计值的映射两方面考虑了缺失数据的影响。仿真例子验证了该算法的有效性。 相似文献
7.
由于飞行参数记录系统所记录的数据很容易被污染,所以对飞参数据进行预处理已显得十分重要,而预处理的一项重要内容就是对缺失参数数据进行合理且有效地估计,真实地反映飞行器当时的状态.通过分析神经网络理论和飞参数据特征,提出了一种基于BP神经网络的缺失数据估计的方法,有效地解决了目前飞行参数记录系统记录数据时缺失数据的问题.利用某型飞机真实的数据进行仿真,结果表明了这种方法是可行且有效的. 相似文献
8.
针对基于GPS的浮动车技术因无法做到对路网的时空间全覆盖导致部分路段实时交通状态缺失问题,提出基于热门路段个性化诊断(personality diagnosis base on popular road,PDPR)模型对各路段上的缺失速度值进行估计。使用K均值算法对所有原始数据作离散化处理,根据数据覆盖率对路段进行分类;以高覆盖率路段的速度数据为辅助,使用个性诊断算法(personality diagnosis,PD)对低覆盖率路段进行缺失速度估计,把估计值映射到连续型空间。实验结果表明,PDPR模型估计误差比PPCA(probabilistic principal component analysis)算法低32.84%,比滑动平均法低5.70%。 相似文献
9.
基于逐步回归分析的基因表达缺失值估计 总被引:1,自引:0,他引:1
在基因芯片实验中,数据缺失客观存在,并且在一定程度上会影响芯片数据后续分析结果的准确性。在不增加实验次数的情况下,缺失值估计是降低缺失数据对后续分析影响的有效方法。针对基因表达数据的特点,提出了基于逐步回归分析方法的基因表达缺失值估计算法。实验结果表明,新的估计算法具有较传统缺失值估计算法更好的稳定性和估计准确度。 相似文献
10.
针对无线传感器网络(WSN)中感知数据易缺失问题,提出了一种基于感知数据属性相关性的缺失值估计方法。该方法采用多元线性回归模型,对属性相关的感知数据的缺失值进行估计;同时,为提高算法估计的鲁棒性,提出了基于感知数据属性的数据交织传送策略。仿真结果表明,所提出的估计方法能有效估计无线传感器网络中的缺失值,相比基于时空相关性的线性插值模型(LM)算法和传统的最近邻插值(NNI)算法具有更高的精度和稳定性。 相似文献
11.
Based on independent component analysis (ICA) and self-organizing maps (SOM), this paper proposes an ISOM-DH model for the
incomplete data’s handling in data mining. Under these circumstances the data remain dependent and non-Gaussian, this model
can make full use of the information of the given data to estimate the missing data and can visualize the handled high-dimensional
data. Compared with mixture of principal component analyzers (MPCA), mean method and standard SOM-based fuzzy map model, ISOM-DH
model can be applied to more cases, thus performing its superiority. Meanwhile, the correctness and reasonableness of ISOM-DH
model is also validated by the experiment carried out in this paper. 相似文献
12.
新颖检测中,可应用高斯混合模型建立已知数据模型,拟合数据分布,但当数据维数较高时,自由参数太多,训练需要巨大的数据采样,而ICA搜寻数据的最大统计独立表示,可以将数据从高维空间投影到低维空间。提出一种基于ICA空间高斯混合模型的新颖检测,可有效减少估测的自由参数,降低训练数据采样的苛刻要求,实验也验证了该方法的可行性。 相似文献
13.
14.
15.
16.
基于PCA和ICA的虹膜识别方法 总被引:2,自引:1,他引:2
为了提高虹膜识别的正确率,提出了利用主成分分析(PCA)与独立成分分析(ICA)相结合的方法,来对虹膜进行识别的方法。用该方法进行虹膜识别时,首先对预处理后的虹膜图像,利用PCA算法进行去二阶相关和降维处理;然后再进行ICA训练。ICA训练采用了以下两种方法:方法1,将参与ICA训练的图像看作是随机变量,而将图像中的像素值看作是随机实验结果,ICA训练后即可得到相互独立的ICA虹膜基图像;方法2,将图像中的像素值看作是随机变量,而将图像看作是随机实验结果,ICA训练后即得到相互独立的ICA系数。采用CASIA虹膜数据库进行的试验结果表明,基于PCA和ICA的虹膜识别算法在两种训练方式下的正确识别率分别达到98.89%和98.33%。 相似文献
17.
18.
介绍了核独立分量分析(ICA)的基本原理和算法,并将其用于对电流传感器输出的混合信号进行分离,通过比较分离出的单频测试信号输入前后的相位差,来标定传感器本身的相位差对其检测对象的影响。此外,还采用最大似然法对核ICA的分离效果进行评价。实验证明:在输入信号的信噪比为18.73dB的情况下,核ICA分离出的信号与源信号相位差在0.002 rad以内,达到了实际应用中所要求的误差范围。 相似文献
19.
针对fM RI数据信噪比低、数据量大的特点,将Pearson分布族应用于独立成分分析算法中,提出基于Pearson系统的独立成分分析算法。增加非线性函数生成器,改进调整步长的方法,能根据观测数据自适应地估计非线性函数。改进的算法与原ICA算法相比,运行速度时间缩短,在fM RI信号分离中取得了较好的效果。将该算法应用于颜色和形状的特征捆绑认知中,得出参与捆绑认知的各大脑区域的主要作用,为建立视觉特征捆绑的认知模型提供理论基础。 相似文献