基于粗糙集的海量数据挖掘算法研究 |
| |
作者单位: | ;1.南阳理工学院 |
| |
摘 要: | 针对传统数据挖掘算法在数据量级方面的局限性,提出在粗糙集理论的基础上,采用类分布链表结构改进传统的基于属性重要性的数据离散化算法、属性约简算法以及基于启发式的值约简算法。讨论了基于动态聚类的两步离散化算法,当算法适应大数据处理之后,采用并行计算的方法提高算法的执行效率。算法测试结果表明,改进算法能有效地处理大数据量,同时并行计算解决了大数据量处理带来的效率问题。
|
关 键 词: | 数据挖掘 粗糙集 大数据处理 并行计算 |
Research on big data mining algorithm based on rough set |
| |
Abstract: | |
| |
Keywords: | |
|
|