首页 | 本学科首页   官方微博 | 高级检索  
     

基于数据库抽样的海量数据分类算法研究
引用本文:李雪婵. 基于数据库抽样的海量数据分类算法研究[J]. 计算机科学, 2008, 35(6): 299-300
作者姓名:李雪婵
作者单位:广东广播电视大学,广州,510091
摘    要:本文对目前比较优秀的各种分类方法进行了介绍、分析和比较.在此基础上,借鉴决策树方法的快速分类特性,提出了一种基于数据库抽样的海量数据分类算法,给出了算法的设计思想和实现原理,并对多处理环境下的优化进行了探讨.实验研究表明,该算法可以明显提高海量数据库的分类效率.

关 键 词:分类  算法  海量数据  数据库

Research on Classification Calculation Way of a Great Amount of Data According to the Database Sampling
LI Xue-chan. Research on Classification Calculation Way of a Great Amount of Data According to the Database Sampling[J]. Computer Science, 2008, 35(6): 299-300
Authors:LI Xue-chan
Affiliation:LI Xue-chan(Guangdong Radio & TV University,Guangzhou 510091,China)
Abstract:In this paper,some excellent classifying methods are introduced and analyzed first. Then the quick classifying character of decision tree method is used for reference,and a mass data classification algorithm is proposed based on database sampling. Both the designing thoughts and implementation principle of the algorithm are given. The optimization of the algorithm is also discussed in multi-processor environment. An example shows that,this classifying algorithm can improve the efficiency of classification i...
Keywords:Classification  Algorithm  Mass data  Database  
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机科学》浏览原始摘要信息
点击此处可从《计算机科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号