首页 | 本学科首页   官方微博 | 高级检索  
     

基于特征融合的中文简历解析方法研究
作者姓名:陈毅  符磊  代云霞  张剑
作者单位:重庆邮电大学 光通信与网络重点实验室,重庆 400065;北京大学深圳研究院,广东 深圳 518057;深港产学研基地 深圳市智能媒体和语音重点实验室,广东 深圳 518057;安徽大学 计算机智能与信号处理教育部重点实验室,合肥 230601;北京大学深圳研究院,广东 深圳 518057;深港产学研基地 深圳市智能媒体和语音重点实验室,广东 深圳 518057;重庆邮电大学 光通信与网络重点实验室,重庆,400065;北京大学深圳研究院,广东 深圳 518057;深港产学研基地 深圳市智能媒体和语音重点实验室,广东 深圳 518057
基金项目:国家自然科学基金;深圳市科技计划;深圳市科技计划
摘    要:针对基于规则和统计的传统中文简历解析方法效率低、成本高、泛化能力差的缺点,提出一种基于特征融合的中文简历解析方法,即级联Word2Vec生成的词向量和用BLSTM(Bidirectional Long Short-Term Memory)建模字序列生成的词向量,然后再结合BLSTM和CRF(Conditional Random Fields)对中文简历进行解析(BLSTM-CRF)。为了提高中文简历解析的效率,级联包含字序列信息的词向量和用Word2Vec生成的词向量,融合成一个新的词向量表示;再由BLSTM强大的学习能力融合词的上下文信息,输出所有可能标签序列的分值给CRF层;再由CRF引入标签之间约束关系求解最优序列。利用梯度下降算法训练神经网络,使用预先训练的词向量和Dropout优化神经网络,最终完成对中文简历的解析工作。实验结果表明,所提的特征融合方法优于传统的简历解析方法。

关 键 词:中文简历  简历解析  特征融合  词向量  神经网络
本文献已被 维普 万方数据 等数据库收录!
点击此处可从《计算机工程与应用》浏览原始摘要信息
点击此处可从《计算机工程与应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号