首页 | 本学科首页   官方微博 | 高级检索  
     

网络用语词典的构建及问题分析
引用本文:昝红英,许鸿飞,张坤丽,穗志方. 网络用语词典的构建及问题分析[J]. 中文信息学报, 2016, 30(6): 133-139
作者姓名:昝红英  许鸿飞  张坤丽  穗志方
作者单位:1. 郑州大学 信息工程学院,河南 郑州 450001;2. 北京大学 计算语言学研究所,北京 100871
基金项目:国家重点基础研究发展计划 973 课题(2014CB340504);国家自然科学基金(61402419);国家社会科学基金(14BYY096);河南省科技厅基础研究项目(142300410231,142300410308);河南省教育厅科学技术研究重点项目(13B520381,15A520098)
摘    要:随着互联网应用的快速发展,网络用语的使用越来越普遍,网络新词层出不穷。网络文本中大量的网络用语,对基于自然语言处理的情感分析、产品推荐、问答系统等应用带来了一定的挑战,而收集并构建网络用语词典及相关语料则是解决此类问题的突破点。该文以微博语料为出发点,综合多类网络资源,收集并整理了较为全面的网络用语词典及相关语料。同时,对网络用语词典构建中遇到的问题进行了分析和总结,并对其潜在应用进行了初步的探讨。

关 键 词:网络用语  词典构建  标注
  

The Construction of Internet Slang Dictionary and Its Analysis
ZAN Hongying,XU Hongfei,ZHANG Kunli,SUI Zhifang. The Construction of Internet Slang Dictionary and Its Analysis[J]. Journal of Chinese Information Processing, 2016, 30(6): 133-139
Authors:ZAN Hongying  XU Hongfei  ZHANG Kunli  SUI Zhifang
Affiliation:1. School of Information Engineering, Zhengzhou University, Zhengzhou, Henan 450001, China;
2. Institute of Computational Linguistics, Peking University, Beijing 100871, China
Abstract:With the rapid development of the Internet, the internet stangs are becomming common and now shangs are constantly apparing. To deal with this challenge for natural language processing tasks like sentiment analysis, product recommendation, QA, etc., an internet slang dictionary is necessary. This paper analyzes the problems encountered when collecting and annotating micro-blog texts, together with other internet resources, to build the dictionary and the related corpus. Further, the potential applications of this dictionary and the corpus is discussed.
Keywords:Internet slang   construction of dictionary   annotation
 
        
 
        
 
        
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号