首页 | 本学科首页   官方微博 | 高级检索  
     

单词嵌入-自然语言的连续空间表示
引用本文:陈恩红 丘思语 许畅 田飞 刘铁岩. 单词嵌入-自然语言的连续空间表示[J]. 数据采集与处理, 2014, 29(1): 19-29
作者姓名:陈恩红 丘思语 许畅 田飞 刘铁岩
作者单位:中国科学技术大学计算机科学与技术系
摘    要:单词嵌入是指运用机器学习的方法,将位于高维离散空间(维数为词典单词数目)中的每个单词映射到低维连续空间的实数向量的技术。在很多文本处理的任务中,单词嵌入提供了更好的语义级别的单词特征表示,从而为文本处理任务带来了诸多便利。同时,大数据时代海量的未标注文本数据,以及以深度学习为代表的机器学习技术的发展使高效的单词嵌入技术成为可能。本文将给出单词嵌入的定义以及实际意义,同时将综述目前单词嵌入技术的几种典型方法,包括基于神经网络的方法、基于受限玻尔兹曼机的方法以及基于单词与上下文共生矩阵分解的方法。本文将详细介绍不同模型的数学定义、物理意义以及训练方法,并给出他们之间的比较。

关 键 词:机器学习;自然语言;单词嵌入;文本处理

Word Embedding: Continuous Space Represengtation for Natural Language
Chen Enhong,Qiu Siyu,Xu Chang,Tian Fei,Liu Tieyan. Word Embedding: Continuous Space Represengtation for Natural Language[J]. Journal of Data Acquisition & Processing, 2014, 29(1): 19-29
Authors:Chen Enhong  Qiu Siyu  Xu Chang  Tian Fei  Liu Tieyan
Abstract:
Keywords:machine learning   natural language   word embedding   text processing
点击此处可从《数据采集与处理》浏览原始摘要信息
点击此处可从《数据采集与处理》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号