首页 | 本学科首页   官方微博 | 高级检索  
     

大规模文本数据的分类系统的设计与实现
引用本文:杨爱芹.大规模文本数据的分类系统的设计与实现[J].电脑与微电子技术,2012(17):7-11.
作者姓名:杨爱芹
作者单位:四川大学计算机系,成都610063
摘    要:云计算模式解决了大规模数据存储和计算能力上存在的瓶颈,为大规模数据挖掘技术提供了理想的计算模式和技术手段。分析Hadoop云计算平台的数据存储和计算模型,在云计算模式的基础上.实现云计算平台上Web文本数据的贝叶斯分类模型。对于大规模数据挖掘中的数据存储和计算的问题和难点.提出一种高效、低成本的解决方案。

关 键 词:云计算  朴素贝叶斯  文本数据分类

Design and Implementation of Large Scale Text Data Classification System
Authors:YANG Ai-qin
Affiliation:YANG Ai-qin ( Department of Computer Science and Technology, Sichuan University,Chengdu 610063)
Abstract:The cloud computing model solves the bottleneck in the storage and computing power of largescale data, and provides an ideal computing model and the technical means for large-scale data mining. Analyzes the data storage and computing model in Hadoop. Based on the cloud com- puting model, establishes the Bayesian classification model for the Web text data on cloud computing platform. And proposes the economical and efficient solutions to solve the problems of storage and computing power for large-scale data.
Keywords:Cloud Computing  Navve Bayes  Text Data Classification
本文献已被 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号