基于特征融合的中文简历解析方法研究 |
| |
作者姓名: | 陈毅 符磊 代云霞 张剑 |
| |
作者单位: | 重庆邮电大学 光通信与网络重点实验室,重庆 400065;北京大学深圳研究院,广东 深圳 518057;深港产学研基地 深圳市智能媒体和语音重点实验室,广东 深圳 518057;安徽大学 计算机智能与信号处理教育部重点实验室,合肥 230601;北京大学深圳研究院,广东 深圳 518057;深港产学研基地 深圳市智能媒体和语音重点实验室,广东 深圳 518057;重庆邮电大学 光通信与网络重点实验室,重庆,400065;北京大学深圳研究院,广东 深圳 518057;深港产学研基地 深圳市智能媒体和语音重点实验室,广东 深圳 518057 |
| |
基金项目: | 国家自然科学基金;深圳市科技计划;深圳市科技计划 |
| |
摘 要: | 针对基于规则和统计的传统中文简历解析方法效率低、成本高、泛化能力差的缺点,提出一种基于特征融合的中文简历解析方法,即级联Word2Vec生成的词向量和用BLSTM(Bidirectional Long Short-Term Memory)建模字序列生成的词向量,然后再结合BLSTM和CRF(Conditional Random Fields)对中文简历进行解析(BLSTM-CRF)。为了提高中文简历解析的效率,级联包含字序列信息的词向量和用Word2Vec生成的词向量,融合成一个新的词向量表示;再由BLSTM强大的学习能力融合词的上下文信息,输出所有可能标签序列的分值给CRF层;再由CRF引入标签之间约束关系求解最优序列。利用梯度下降算法训练神经网络,使用预先训练的词向量和Dropout优化神经网络,最终完成对中文简历的解析工作。实验结果表明,所提的特征融合方法优于传统的简历解析方法。
|
关 键 词: | 中文简历 简历解析 特征融合 词向量 神经网络 |
本文献已被 维普 万方数据 等数据库收录! |
| 点击此处可从《计算机工程与应用》浏览原始摘要信息 |
|
点击此处可从《计算机工程与应用》下载全文 |
|