共查询到19条相似文献,搜索用时 46 毫秒
1.
基于Rough Set理论发现最小归纳依赖关系的方法研究 总被引:4,自引:0,他引:4
归纳依赖关系是数据库研究领域的重要概念,在数据库中自动发现最小归纳依赖关系对数据采掘具有重大意义。介绍了归纳依赖关系的概念、原理及利用Rough Set理论度量数据属性间归纳依赖强度的方法,提出了一个在数据库中自动发现最小归纳依赖关系的算法。 相似文献
2.
一种基于Rough集理论的数据过滤方法 总被引:10,自引:1,他引:10
Routh集理论是一种处理不确定模糊知识的重要工具,在对Rough集理论进行深入研究的基础上,提出了一种基于Rough集理论的这滤算法。该处 工硒思想是基于P-确定的等价类的合并,算法直观,计算简便,理论和实验表明,该算法能够减低信息系统中信息的粒度,在保持规则近似质量不变的前提下,有效地提高规则的统计意义和预测强度。 相似文献
3.
基于Rough Set的数据预处理 总被引:2,自引:0,他引:2
RoughSet理论是一种新的处理不精确,不完全与不相容知识的数学工具。数据预处理是数据挖掘中必不可少的步骤,处理的结果对下一步数据挖掘有直接影响。论文利用RoughSet一些特性对KDD99中的数据集进行处理,并且针对数据集的特点实现了对其进行数据离散化、属性约简等处理。通过这些处理过程为下一步的数据挖掘打下了基础。 相似文献
4.
随着数据挖掘的兴起,有许多分类和预测的方法。数据挖掘研究的实旌对象多为关系型数据库,这给粗糙集方法的应用带来了极大的方便。关系表可被看作为粗糙集理论中的决策表,而利用粗糙集理论来处理数据挖掘有着传统挖掘工具所不具有的优点。粗糙集理论是一种处理不确定和不精确问题的数学工具,文中通过实例介绍了粗糙集的基本理论,并通过实例详细介绍了在基于对决策表属性约简的基础上采用了可变精度粗糙模型实现规则的获取。该实例说明了对于不完备的信息系统,应用粗糙集理论进行数据挖掘是非常有效的。 相似文献
5.
6.
纪滨 《计算机技术与发展》2008,18(2):126-128,132
随着数据挖掘的兴起,有许多分类和预测的方法.数据挖掘研究的实施对象多为关系型数据库,这给粗糙集方法的应用带来了极大的方便.关系表可被看作为粗糙集理论中的决策表,而利用粗糙集理论来处理数据挖掘有着传统挖掘工具所不具有的优点.粗糙集理论是一种处理不确定和不精确问题的数学工具,文中通过实例介绍了粗糙集的基本理论,并通过实例详细介绍了在基于对决策表属性约简的基础上采用了可变精度粗糙模型实现规则的获取.该实例说明了对于不完备的信息系统,应用粗糙集理论进行数据挖掘是非常有效的. 相似文献
7.
8.
9.
一种基于Rough Set的海量数据分割算法 总被引:2,自引:0,他引:2
处理海量数据一直是数据挖掘要解决的一个重要问题.目前已有许多并行或串行的算法来处理海量数据,然而这些算法通常都不能很好地解决速度和正确率之间的矛盾.分布式运算在处理数据上具有明显优势,因此本文考虑将一个原始的海量数据集分割成许多个独立的小数据集进行分布式处理.本文首先根据Rough Set的特点提出最佳分割的定义,然后提出一种海量数据分割算法来寻找最佳分割.通过实验测试证明结合本文提出的数据分割算法的分布式处理方案能够快速处理海量数据,而且与处理整个数据集的算法相比,正确性较高. 相似文献
10.
粗糙集理论是研究模糊性和不确定性知识的一种新的数学工具.在保持分类能力不变的前提下,通过知识约简,导出问题的决策或分类规则.以基于粗糙集理论的数据挖掘模型为背景,系统应用粗糙集的理论与方法,对采集的数据进行分析比较,并通过具体的应用,表明此算法构造的模型简单、实用,达到了满意的结果. 相似文献
11.
一种基于粗集理论属性约简的粗化算法 总被引:2,自引:0,他引:2
本文基于粗集理论,针对知识表达系统提出了一种新的归纳学习方法,对该方法中条件属性的简化进行了详细的讨论,并给出了一种具体的属性约简算法,其特点是简单,容易实现,考虑了属性值代表范围的合理性。 相似文献
12.
基于粗糙集理论对推理通道问题进行了研究。通过采用属性约简和属性值约简方法对数据库中的数据进行处理。在属性值约简基础之上,采用一种改进算法找出了数据库中推理规则集。进一步,将推理规则集中属性频率高的属性安全级别提高至决策属性的安全级别,从而消除推理通道。最后通过一个实例表明提出的消除通道算法是有效的。 相似文献
13.
随着Web信息容量迅速膨胀,对Web文本分类已经是目前研究的热点.传统的Web文本分类对网页的预处理基本上没有考虑网页中的大量噪音,因此对分类结果有一定的影响;另一方面,文本的向量空间模型维数过高,对分类效果也存在很大的影响.提出一种基于粗糙集理论的Web文本分类方法,首先对网页进行去噪,然后对向量空间模型进行属性约简,之后构造分类器,实验表明,此方法不仅降低了维数,还提高了分类结果. 相似文献
14.
15.
一种基于Rough集理论的不完备数据分析方法 总被引:1,自引:0,他引:1
Rough集方法是一种处理不确定或模糊知识的重要工具.本文对基于Rough集理论中的差异矩阵进行了研究.在引入扩充差异矩阵的基础上,提出了一种基于Rough集理论的不完备数据分析方法ROUSTIDA.该方法充分利用Rough集分析方法的优点,只需利用信息系统提供的信息,不需要另外附加信息,计算简单、直观.实验表明,该方法能充分利用信息系统中数据所反映的规律性,能有效地对不完备信息系统进行完整化分析. 相似文献
16.
基于Rough集的数据挖掘模型研究 总被引:13,自引:0,他引:13
这项工作的主要目的是表明怎样能够有效地实现基于Rough集的数据挖掘技术,在这篇论文里,我们详细讨论了Rough集理论,为了从基于Rough集的数据库中发现新的规则,研究了一种适合数据挖掘的面向对象的软件系结构,给出了数据挖掘算法、规则发现算法和规则约简算法,从初始数据库的信息出发,依次建造差别矩阵、约简表和规则表,最后给出了一个模拟实例,表明我们的模型和算法是可行的。 相似文献
17.
在教育领域中常常会进行教学评价、学习评价等调查活动,而学生填写的数据有很大的随意性。为评判调查数据的可信度,引入粗集理论,先对属性集合进行初步约简,再利用条件属性的重要度确定约简中各属性权重,最后由模糊评判方法来衡量调查数据的可信度。其中,模糊关系矩阵由选择可信度来确定。实例分析结果表明,该方法是可行的、有效的。 相似文献
18.
随着气象信息化程度不断提高,气象部门积累了海量的气象数据,如何从海量的数据中获取有用的知识,成为人们关注的重点。气象数据具有维度高、依赖性强等特点,这就对气象数据挖掘提出了更高的要求。经典数据挖掘算法在处理海量气象数据时在性能与准确率方面无法获得较好的结果。在分析了MapReduce计算模型与粗糙集、贝叶斯分类的基础上,给出了基于MapReduce的计算等价类的数据约简算法与朴素贝叶斯分类算法。最后在Hadoop平台上进行了相关实验。实验结果表明,该并行数据挖掘方案可以有效处理海量气象数据,并具有良好的扩展性。 相似文献
19.
粗糙集理论的主要思想是在保持信息系统分类能力不变的前提下,通过知识约简,导出问题的决策和分类规则:本文提出一种基于信息量的属性约简和规则提取的集成算法,并结合汽车里程试验数据进行验证,通过仿真实验,表明了该算法的有效性和可行性。 相似文献