首页 | 本学科首页   官方微博 | 高级检索  
     

基于MapReduce框架一种文本挖掘算法的设计与实现
引用本文:朱蔷蔷,张桂芸,刘文龙.基于MapReduce框架一种文本挖掘算法的设计与实现[J].郑州大学学报(工学版),2012,33(5):110-113.
作者姓名:朱蔷蔷  张桂芸  刘文龙
作者单位:天津师范大学计算机与信息工程学院,天津,300387
基金项目:国家自然科学基金资助项目,天津市教委资助项目,天津市科技支撑计划重点项目,天津师大博士基金项目
摘    要:随着文本挖掘在主动信息服务中应用的日益扩展,在文本数据的基础上分析数据的内在特征已经成为目前的研究趋势,本文在Hadoop平台上设计并实现了一种文本挖掘算法,该算法利用Ma-pReduce框架按照自然语料中相邻词组出现的频数进行降序输出,从而有助于用户挖掘大量数据中各项集之间的联系,实验结果体现了该算法的有效性和良好的加速比.

关 键 词:Hadoop  MapReduce  相邻词组  降序输出

The Design and Implemention of a Text Mining Algorithm Based on MapReduce Framework
ZHU Qiang-qiang , ZHANG Gui-yun , LIU Wen-long.The Design and Implemention of a Text Mining Algorithm Based on MapReduce Framework[J].Journal of Zhengzhou University: Eng Sci,2012,33(5):110-113.
Authors:ZHU Qiang-qiang  ZHANG Gui-yun  LIU Wen-long
Affiliation:(College of Computer and Information Engineering,Tianjin Normal University,Tianjin 300387,China)
Abstract:
Keywords:
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号