首页 | 本学科首页   官方微博 | 高级检索  
     

数据簸箕
引用本文:钱宇华,成红红,张晓琴,梁吉业.数据簸箕[J].计算机科学与探索,2013(11).
作者姓名:钱宇华  成红红  张晓琴  梁吉业
作者单位:1. 山西大学 计算机与信息技术学院,太原,030006
2. 山西大学 数学科学学院,太原,030006
基金项目:70971080,the National Basic Research Program of China under Grant No.2007CB31102(国家重点基础研究发展计划,the Natural Science Foundation of Shanxi Province of China under Grant Nos.2008011038
摘    要:大数据时代的到来给数据挖掘和知识发现带来了很大的挑战。簸箕是一种大家熟知的农用工具,能快速将不同的物体分开。基于簸箕的工作机制,提出了一个新颖的学习原理:随机并行序化原理(random parallel ranking principle,RPRP),称为数据簸箕,可高效地对数据进行排序和分类。为了验证这种学习原理的有效性与高效性,设计了一种新的聚类方法,即聚类簸箕。实验结果表明,聚类簸箕能够快速且有效地对数据进行聚类。此外,该学习原理也能够用于设计高效的分类器。该数据簸箕有望推动大数据背景下机器学习与知识发现理论与方法的发展。

关 键 词:大数据集  数据簸箕  随机并行序化原理(RPRP)  聚类簸箕

Data Dustpan
QIAN Yuhua , CHENG Honghong , ZHANG Xiaoqin , LIANG Jiye.Data Dustpan[J].Journal of Frontier of Computer Science and Technology,2013(11).
Authors:QIAN Yuhua  CHENG Honghong  ZHANG Xiaoqin  LIANG Jiye
Abstract:
Keywords:very-large-scale data set  data dustpan  random parallel ranking principle (RPRP)  clustering dustpan
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号