首页 | 本学科首页   官方微博 | 高级检索  
     

基于CNN与双向LSTM的中文文本蕴含识别方法
引用本文:谭咏梅,刘姝雯,吕学强.基于CNN与双向LSTM的中文文本蕴含识别方法[J].中文信息学报,2018,32(7):11-19.
作者姓名:谭咏梅  刘姝雯  吕学强
作者单位:1.北京邮电大学 计算机学院,北京 100876;
2.北京信息科技大学 网络文化与数字传播北京市重点实验室,北京 100101
基金项目:网络文化与数字传播北京市重点实验室开放课题(ICDD201703);国家自然科学基金(61671070)
摘    要:为了避免基于传统机器学习的中文文本蕴含识别方法需要人工筛选大量特征以及使用多种自然语言处理工具造成的错误累计问题,该文提出了基于CNN与双向LSTM的中文文本蕴含识别方法。该方法使用CNN与双向LSTM分别对句子进行编码,自动提取相关特征,然后使用全连接层进行分类得到初步的识别结果,最后使用语义规则对网络识别结果进行修正,得到最终的蕴含识别结果。在2014年RITE-VAL评测任务的数据集上MacroF1结果为61.74%,超过评测第一名的结果61.51%。实验结果表明,该方法对于中文文本蕴含识别是有效的。

关 键 词:中文文本蕴含  卷积神经网络  双向长短时记忆网络  

CNN and BiLSTM Based Chinese Textual Entailment Recognition
TAN Yongmei,LIU Shuwen,LV Xueqiang.CNN and BiLSTM Based Chinese Textual Entailment Recognition[J].Journal of Chinese Information Processing,2018,32(7):11-19.
Authors:TAN Yongmei  LIU Shuwen  LV Xueqiang
Affiliation:1.School of Computer Science, Beijing University of Posts and Telecommunications, Beijing 100876, China;
2.Beijing Key Laboratory of Internet Culture and Digital Dissemination Research, Beijing Information Science and Technology University, Beijing 100101, China
Abstract:A CNN and BiLSTM based Chinese textual entailment recognition method is presented. By using CNN and BiLSTM, the method can automatically extract relevant features, and then generate the initial result by a fully connected layer. The final result is further processed by semantic rules. Evaluated on the dataset of RITE-VAL in 2014, the method obtains 61.74%, outperforming the top-ranked 61.51% in that evaluation campaign.
Keywords:Chinese textual entailment  convolutional neural network  bidirectional long short-term memory network  
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号