首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
该文在对粗集理论进行深入研究的基础上,依据决策规则独立原则,提出了一种改进的ROUSTIDA算法,有效地解决了原算法可能存在的决策规则矛盾的问题,实例表明此方法是行之有效的。  相似文献   

2.
为了有效地清洗数据,此前已经提出了很多的完整性约束规则,例如条件函数依赖、条件包含依赖.这些约束规则虽然可以侦测出错误的存在,但是不能有效地指导用户纠正错误.实际上,基于约束规则的数据修复可能最终得不到确定性的修复结果,相反会引入新的错误,因此很大程度上降低了数据修复的效率.针对以上不足,提出了一种有效的数据清洗框架:首先基于Editing Rules和Master Data对数据进行清洗操作,最终得到确定性的修复;然后依据条件函数依赖来修复遗漏的错误,此种修复结果是不确定的,但是相比之下该框架不仅可以有效地保证数据修复的精确性与唯一性,而且提高了数据修复的效率.  相似文献   

3.
一种基于粗糙集的信息系统决策规则提取方法   总被引:5,自引:0,他引:5  
以粗糙集理论为基础,引入相似性的概念,并提出其衡量方法,改进了粗糙集理论中不可辨关系的确定条件,给出了基于新的相似关系的上下近似空间定义,并举例说明了基于粗糙集的相似性规则提取方法。  相似文献   

4.
提出了一种基于粗糙集理论的面向个性化知识的决策规则获取算法。从理论上证明了算法的正确性,给出了面向个性化的知识获取算法的描述。算法的重点在于规则合成的方法和可信度、覆盖度和规则强度计算的方法。最后通过例子说明了算法的有效性和实用性。  相似文献   

5.
交通流数据清洗规则研究   总被引:2,自引:0,他引:2       下载免费PDF全文
王晓原  张敬磊  吴芳 《计算机工程》2011,37(20):191-193
交通检测器获得的数据存在无效、冗余、错误、时间点漂移及丢失等质量问题。为此,在分析影响数据质量问题原因的基础上,给出交通流数据清洗的概念,研究“脏数据”的清洗规则与清洗步骤,并对环形线圈检测器检测到的数据进行验证。结果表明,该清洗规则对错误、丢失、冗余等“脏数据”的识别率均在90%以上。  相似文献   

6.
一种基于分类一致性的决策规则获取算法   总被引:3,自引:3,他引:3       下载免费PDF全文
代建华  潘云鹤 《控制与决策》2004,19(10):1086-1090
提出一种基于分类一致性的规则获取算法.它是一种例化方向的方法,即从空集开始,以条件属性子集的分类一致性来度量属性的重要性,逐步加入重要的属性,当选择的属性子集能够正确分类时,则获取到决策规则.算法中设计了一个规则约简过程,用来简化所获得的规则,增强规则的泛化能力.实验结果表明,所提出的算法获得的规则更为简洁和高效.  相似文献   

7.
以往数据清洗工具在三个方面存在不足:工具和用户之间缺少交互,用户无法控制过程,也无法处理过程中的异常;数据转化和数据清洗规则缺少逻辑描述,没有达到与物理实现的分离;缺少元数据管理,用户很难分析和逐步调整数据清洗过程。文中提出了一种新的基于规则描述的交互式数据清洗框架,解决了上述三个方面存在的不足,提高了数据清洗的效率,使得数据的质量得到保证。并通过描述清洗规则的定义和执行,详细阐述了该清洗框架的结构。  相似文献   

8.
以往数据清洗工具在三个方面存在不足:工具和用户之间缺少交互,用户无法控制过程,也无法处理过程中的异常;数据转化和数据清洗规则缺少逻辑描述,没有达到与物理实现的分离;缺少元数据管理,用户很难分析和逐步调整数据清洗过程.文中提出了一种新的基于规则描述的交互式数据清洗框架,解决了上述三个方面存在的不足,提高了数据清洗的效率,使得数据的质量得到保证.并通过描述清洗规则的定义和执行,详细阐述了该清洗框架的结构.  相似文献   

9.
针对日前数据清洗框架中普遍存在的交互性和可扩展性差的问题,本文从数据清洗的定义出发,分析了数据清洗的原理和流程,并在此基础上提出了一种基于规则的交互式数据清洗框架.该框架具有较好的交互性、可扩展性和通用性.  相似文献   

10.
一种增量式规则提取算法   总被引:6,自引:0,他引:6  
扩展了决策矩阵的定义,并在此基础上提出一种增量式规则提取算法(IREA),该算法能够以增量的方式从样本数据中提取确定性和可能性规则.对于缺乏领域知识时的知识/规则获取具有重要使用价值.  相似文献   

11.
周生炳 《软件学报》1997,8(10):798-800
本文提出SLD-博弈树的成功集的概念,证明对任何计算规则R,对应R产的SLD-博弈树的成功集相同,即SLD-博弈树的证明能力与计算规则无关,这就是计算规则的独立性.  相似文献   

12.
概念格上规则提取的一般算法与渐进式算法   总被引:40,自引:2,他引:40  
许多研究表明概念格是数据分析与规则提取的一种有效工具。本文首先提出一种在对象与描述符数目较多、概念聚类具有一定规模条件下,在已建造好的概念格上有效地提取规则的算法。这种方法主要依据格结点的直接泛化来产生相应无冗余规则,然后改进了一种渐进式更新概念格与相应Hasse图的算法,并将之应用于渐进式提取规则。目前,这些方法已用于我们所开发的数据库知识发现工具原型系统中。  相似文献   

13.
14.
肖继耀 《计算机学报》1992,15(5):346-355
本文从符号计算(计算机代数)的观点,对数值矩阵计算理论中传统的奇异值分解算法及其相关的广义逆矩阵计算方法加以改进,使之适于处理符号矩阵且在计算机上实现.并指出其在矩阵理论及线性问题求解中的某些应用,还给出了一个有趣的物理实例.  相似文献   

15.
在KDD和Data Mining 中我们的部分工作和看法   总被引:1,自引:0,他引:1  
本文介绍了什么是KDD和Data Mining,目前国 外在Data Mining中研究的一部分重要内容的概况以及几年来我们在KDD和Data Mining中的 部分工作和看法.  相似文献   

16.
电力负荷预测前应首先对负荷数据进行清洗,根据电力日负荷曲线的特征,应用改进的ART-2神经网络准确的提取电力日负荷特征曲线,然后利用支持向量数据描述法对不良数据进行精确定位,最后利用特征曲线对不良数据进行修正.由于ART2网络能够动态调整特征曲线以及支持向量数据描述法快速准确性,使得该清洗模型具有对不良数据进行动态清洗的功能,实例分析说明了该模型的高效性.  相似文献   

17.
动态数据环境下的模式分类及应用   总被引:1,自引:1,他引:0  
郑伟平 《计算机应用》2000,20(11):25-26,30
利用约集的数据采集和分析方法,支动态的环境运用数据集合进行知识采集、验证和运行管理,并依此建立了一个基于对象的概念模型,用于对一些可扩充的数据集合进行预测决策,最后,利用该模型对一个交通灯系统的智能管理例子进行了讨论。  相似文献   

18.
粗糙集理论在故障诊断规则获取中的应用   总被引:7,自引:0,他引:7  
本文的目的是给出一种利用粗糙集理论解决故障诊断的规则获取问题的方法 ,该方法的特点是可以处理由于类重叠引起的样本信息不精确、不一致情况下的规则获取 .以规则形式表示的知识接近于人脑推理过程 ,因此基于规则的诊断方法在故障诊断中得到广泛使用 ,但规则获取是其瓶颈之一 .粗糙集 (RS)理论是为开发自动规则生成系统而提出的 ,其主要思想是在保持分类能力不变的前提下 ,通过知识约简 ,导出概念的分类规则 .因此 ,可以把 RS理论用于规则的故障诊断中 .本文给出了基于决策矩阵和决策函数的获取规则方法的流程图 ,以故障诊断实例说明其使用方法 ,并验证了其有效性  相似文献   

19.
电力数据安全随着电力信息网与互联网的接入变得尤为严峻,其数据与规模愈加庞大复杂.为了对其进行有效的安全分析及特征提取,提出一种基于特征提取的SQL注入攻击检测模型.从Web访问日志中提取SQL注入语法特征和行为特征,得到语法特征矩阵和行为特征矩阵数据集.以漏报率和误报率为评价指标,选取K-means、Naive Bay...  相似文献   

20.
Web包装器是根据特定的抽取规则从特定的Web数据源执行数据抽取程序,设计Web包装器是Web信息抽取和集成的关键技术.针对网页结构的不确定性和易变性,详细阐述了一种基于预定义模式的Web包装器的设计与实现过程,并选取了几个出版社的新书发布Web页面进行了数据抽取验证和抽取结果分析,取得了较好的效果.充分体现了此Web包装器的可行性,并具有一定的高效性及可维护性,能够应用在基于Wrapper/Mediator方法的Web数据集成.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号