首页 | 本学科首页   官方微博 | 高级检索  
     

深度学习中汉语字向量和词向量结合方式探究
引用本文:李伟康,李炜,吴云芳.深度学习中汉语字向量和词向量结合方式探究[J].中文信息学报,2017,31(6):140-146.
作者姓名:李伟康  李炜  吴云芳
作者单位:北京大学 计算语言学教育部重点实验室,北京 100871
基金项目:教育部人文社会科学研究规划基金(13YJA740060);国家自然科学基金(61371129,61773026)
摘    要:该文旨在探究深度学习中汉语字向量和词向量的有效结合方式。我们在以词作为基础语义单元和以字作为基础语义单元这两个方向进行探究,实验了字、词信息多种浅层结合方式和深层结合方式。为了验证该文提出的结合方式的有效性,我们改进了一种compare-aggregate模型,并在基于文档的问答系统上进行了实验。实验结果表明,有效的汉语字向量和词向量的结合方式超越了单独的字向量和词向量,提升了基于文档的问答系统的性能,使其结果与目前最好的结果可媲美。

关 键 词:字向量  词向量  深度学习  问答系统  

Combination Methods of Chinese Character and Word Embeddings in Deep Learning
LI Weikang,LI Wei,WU Yunfang.Combination Methods of Chinese Character and Word Embeddings in Deep Learning[J].Journal of Chinese Information Processing,2017,31(6):140-146.
Authors:LI Weikang  LI Wei  WU Yunfang
Affiliation:Key Laboratory of Computational Linguistics (Peking University), Ministry of Education, Beijing 100871, China
Abstract:This paper investigates the combination of Chinese character and word embeddings in deep learning. We propose to do experiments considering shallow and deep combinations based on word and character. In order to demonstrate the effectiveness of combination, we present a compare-aggregate model solving the problem of question answering. Extensive experiments conducted on the open DBQA data demonstrate that the effective combination of characters and words significantly improves the system achieving comparable results with state-of-art systems.
Keywords:character embedding  word embedding  deep learning  question answering system  
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号