首页 | 本学科首页   官方微博 | 高级检索  
     

基于依存句法分析的社会媒体文本挖掘方法——以饮食习惯特色分析为例
引用本文:任彬,车万翔,刘挺.基于依存句法分析的社会媒体文本挖掘方法——以饮食习惯特色分析为例[J].中文信息学报,2014,28(6):208-215.
作者姓名:任彬  车万翔  刘挺
作者单位:哈尔滨工业大学 社会计算与信息检索研究中心,黑龙江 哈尔滨 150001
基金项目:国家重点基础研究发展计划(973计划)(2014CB340503);国家自然科学基金面上项目(61370164);国家自然科学基金重点项目(61133012)
摘    要:在进行社会媒体文本挖掘时,传统的基于词表的方法,存在准确率较低、词表难获得等问题。该文提出一种基于依存句法分析的文本挖掘方法,通过规则匹配的方式从社会媒体文本中提取信息。该方法不依赖词表,且实验证明了相比基于词表的方法在准确率上有大幅提高。应用基于依存句法分析的文本挖掘方法,我们在微博文本上进行了饮食习惯特色分析,实现了性别、地区、时间等维度的饮食习惯特色分析并可进行交叉分析,最终用词云的方式展示了结果。

关 键 词:依存句法分析  文本挖掘  社会媒体  饮食习惯特色分析  

Dependency Parsing-Based Social Media Text Mining——a Case Study in Analysis of Weibo Users Eating Habits
REN Bin,CHE Wanxiang,LIU Ting.Dependency Parsing-Based Social Media Text Mining——a Case Study in Analysis of Weibo Users Eating Habits[J].Journal of Chinese Information Processing,2014,28(6):208-215.
Authors:REN Bin  CHE Wanxiang  LIU Ting
Affiliation:Research Center for Social Computing and Information Retrieval, School of Computer Science and Technology, Harbin Institute of Technology, Harbin, Heilongjiang 150001
Abstract:For social media text mining, the traditional lexicon method has the problem of lower accuracy and difficulty in lexicon acquisition. This paper proposes a dependency parsing-based text mining method to acquire information from social media text using matching rules. This method can work without lexicons and the experiment results prove a substantial increase in accuracy compared to the lexicon method. Using the dependency parsing-based method, we conducted an eating habits analysis on the Weibo text and achieve results on gender, region, time, including cross-analysis results, which are presented by word clouds.
Keywords:dependency parsing  text mining  social media  eating habits analysis  
本文献已被 CNKI 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号