首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到15条相似文献,搜索用时 78 毫秒
1.
随着数据分析研究的兴起,数据预处理越来越得到研究者的重视,其中缺失数据填补问题的重要性也逐渐显现。在ROUSTIDA数据补齐算法的基础上,针对具有关键属性的重复数据的特点,文中提出了一种改进的ROUSTIDA算法——Key&Rpt_RS算法。Key&Rpt_RS算法继承了ROUSTIDA算法的优势,同时考虑了目标数据的重复性特点,分析了关键属性对填补效果的影响,得到了更加准确且有效的填补结果。  相似文献   

2.
在对粗糙集模型中的基于容差关系的ROUSTIDA算法和基于量化容差关系的VTRIDA算法进行分析的基础上,提出一种综合量化容差关系和限制容差关系的数据填充方法 VLTA(Valued and Limited Tolerance Algorithm)。VLTA算法克服了ROUSTIDA算法在无差别对象属性值发生冲突情况下无法对相同属性进行补齐的缺陷,改进了VTRIDA算法对容差关系不合理的量化定义。实验表明,VLTA算法填充结果准确率更高,更符合实际。  相似文献   

3.
混合值不完备信息系统一种新的数据分析方法*   总被引:1,自引:0,他引:1  
针对混合值不完备信息系统的完备化问题,提出了一种改进的ROUSTIDA算法。对可辨识矩阵的定义在邻域的范围内进行了扩充,使之可以适用于混合值的不完备信息系统,结合极大相容块技术给出了具体的改进算法,使填充能力得到很大的改善,同时还具备了初步排除噪声数据的能力。实例分析表明,该算法是行之有效的。  相似文献   

4.
针对不完备信息表预处理问题中的数据填补问题进行研究,依据决策规则独立原则,提出了一种基于相似关系向量的不完备信息系统数据补齐算法,有效地解决了原有ROUSTIDA算法可能存在的决策规则矛盾问题.实例证明改进算法的填补正确率比ROUSTIDA算法要高,具有更好的实用价值.  相似文献   

5.
不完备信息系统中决策规则的提取是数据挖掘领域的重要研究问题。对不完备信息系统中决策规则的主要获取方法进行分析,以决策属性具有缺失值的不完备决策表为研究对象,提出一种基于数据优先填补的决策树规则提取算法。针对ROUSTIDA算法在数据填补时运算量较大且容易导致决策规则冲突这一问题,算法采用决策属性优先填补的思想,引入对象完备度概念对其进行改进,使用改进的ROUSTIDA算法对不完备决策表进行一次性数据填补预处理,并在限制容差关系下采用属性重要性为启发函数构建决策树,从而获得决策规则。实例表明该方法是有效的,生成的决策规则简单,且具有较高的精确度。  相似文献   

6.
为了提高基于粗糙集理论的不完备数据分析方法(ROUSTIDA)在实际应用中对包含离散型(如整型、字符串型、枚举型)、连续型(如浮点数表达)、缺失型属性的混合信息系统(HIS)数据的填补能力,提出了一种基于粗糙集理论的混合信息系统缺失值填补方法(RSHISMIA)。首先,根据决策属性等价类划分思想并按照决策属性对混合信息系统HIS进行划分,解决了填补后可能出现的决策规则冲突问题;其次,定义混合距离矩阵来合理量化对象间的相似性,从而筛选出具有填补能力的样本并克服ROUSTIDA无法处理连续性属性的缺点;然后,结合近邻思想解决了ROUSTIDA在无差别对象属性值发生冲突情况下无法对相同属性缺失数据进行填补的问题。最后,使用10个UCI标准数据集进行实验,将所提出的方法与ROUSTIDA、K近邻填补(KNNI)算法、随机森林填补(RFI)算法和矩阵分解(MF)等几种经典算法进行了比较。实验结果表明,与ROUSTIDA相比,所提方法在查全率上平均高出81%,在查准率上提升了5%~53%,且其归一化均方根误差(NRMSE)最多减小了0.12。此外,所提方法的分类准确率与ROUSTIDA相比平均提升了7%,且优于KNNI、RFI及MF等填补算法。  相似文献   

7.
不完备数据分析方法(ROUSTIDA)的改进算法   总被引:1,自引:0,他引:1  
针对在实际问题中,数据库中的数据经常受到各种因素的干扰,待处理的数据常有某种程度的不完备的情况,基于粗糙集理论,对不完备信息系统的完备化进行了研究.提出了改进的ROUSTIDA算法,改善了原算法对某些缺失数据不能处理的情况,分别提出了相应的策略,扩充了原算法的适用范围,同时可以在填充时避免不一致信息的产生,对下一步的数据挖掘作好了充分的数据准备.  相似文献   

8.
在对粗糙集理论进行深入研究的基础上,依据决策规则独立原则,提出了一种基于相似关系向量的不完备信息系统数据补齐算法,有效地解决了原有ROUSTIDA算法可能存在的决策规则矛盾问题。实例证明改进算法的填补正确率比ROUSTIDA算法高,具有更好的实用价值。  相似文献   

9.
针对稀疏的用户评分数据,国内外学者对协同过滤算法做了很多改进,归纳为填充法、改进相似度方法、结合内容的推荐等,这些单一方法都不能真正解决数据稀疏的问题。针对这个问题,提出一种填充法和改进相似度相结合的协同过滤算法。该算法首先利用填充法随机填充部分数据,改进的填充法预测评分时融入了项目属性信息,然后利用填充后的数据和新相似度方法做推荐,产生推荐结果,迭代m次,按照迭代m次被推荐项目平均评分的高低进行最后的推荐。实验表明,在数据稀疏的情况下,该算法与单一的方法比有更好的推荐效果。  相似文献   

10.
基于信息增益的数据库缺失值填充算法   总被引:1,自引:1,他引:1  
覃泽 《微计算机信息》2007,23(12):180-181
在数据挖掘以及机器学习等领域,都需要涉及一个数据预处理过程。其中,缺失值的填充是一个非常具有挑战性的任务,因为填充效果的好坏会极大的影响学习算法及挖掘算法的后续处理过程.目前已有的一些填充算法在一定程度上能够处理缺失值问题.与已有的方法不同,提出了一种扩展的基于信息增益的缺失值填充算法,它充分利用数据集中各属性之间隐含的关系对缺失的数据进行填充。大量的实验表明,提出的扩展的基于信息增益的缺失值填充算法是有效的.  相似文献   

11.
基于概率相似度的不完备信息系统数据补齐算法*   总被引:2,自引:1,他引:1  
在决策属性已知、条件属性值分布不确定的情况下,用基于概率相似度原理和按决策属性划分系统的原则,对缺损数据进行填补,可使不完备决策信息系统的完备化具有较高可信度。  相似文献   

12.
该文在对粗集理论进行深入研究的基础上,依据决策规则独立原则,提出了一种改进的ROUSTIDA算法,有效地解决了原算法可能存在的决策规则矛盾的问题,实例表明此方法是行之有效的。  相似文献   

13.
一种基于粗集理论不完备数据的改进算法   总被引:10,自引:0,他引:10       下载免费PDF全文
本文在对粗集理论进入深入研究的基础上,依据决策规则独立原则,提出一种改进的ROUSTIDA算法,有效地解决了原算法可能存在的决策规则矛盾的问题,实例表此方法是行之有效的。  相似文献   

14.
基于粗糙集理论的不完备数据分析方法,以可辨识矩阵作为算法的基础,提出了一种改进的不完备数据分析方法.该方法利用信息系统中数据所反映的规律性,将信息系统对象的条件属性对其决策的影响程度进行量化,使得这种完备化更合理有效.  相似文献   

15.
符欲梅  朱芳  昝昕武 《传感技术学报》2012,25(12):1706-1710
针对桥梁健康监测系统中采集数据具有小样本、非线性且时序的特点,提出一种基于支持向量机的残缺数据填补方法,在分析数据的自相关性基础上,利用支持向量回归机原理,选择适当维数的样本作为支持向量机的输入向量,据此进行了残缺数据的预测;并与BP神经网络的填补效果相比较,实验结果显示了支持向量机在更小样本情况下填补残缺数据的优势和强泛化能力。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号