首页 | 本学科首页   官方微博 | 高级检索  
     

融合分词隐层特征的汉语基本块识别
引用本文:李国臣,刘展鹏,王瑞波,李济洪.融合分词隐层特征的汉语基本块识别[J].中文信息学报,2016,30(2):12-17.
作者姓名:李国臣  刘展鹏  王瑞波  李济洪
作者单位:1. 山西大学 计算机与信息技术学院,山西 太原 030006;
2. 太原工业学院 计算机工程系,山西 太原 030008;
3. 山西大学 计算中心,山西 太原 030006
基金项目:国家自然科学基金(61503228);国家自然科学基金委员会—广东省政府联合基金(第二期)超级计算科学应用研究专项(NSFC 2015—268)
摘    要:该文以字为基本标注单位,构建了一种汉语基本块识别的神经网络学习模型。模型联合分词任务的神经网络学习模型与基本块识别任务模型,将分词任务模型中学习得到的隐层特征融入基本块识别的模型中,两模型相互交替优化学习模型参数,并实现了以整句似然函数(而非单字似然函数)作为优化目标的算法。实验结果表明:1)以整句似然函数为优化目标的基本块识别的F值比单字似然情形要高出1.33%,特别是在多字块识别中,其召回率比单字似然情形要高出4.68%;2)融合分词任务模型中的隐层特征的汉语基本块识别模型的结果比不做融合的模型要高出2.17%,说明融合分词隐层特征的交替联合学习方法是有效的。

关 键 词:分布表征  汉语基本块识别  神经网络模型  隐层特征  整句似然函数  

Chinese Base-Chunk Identification Using Hidden-Layer Feature of Segmentation
LI Guochen,LIU Zhanpeng,WANG Ruibo,LI Jihong.Chinese Base-Chunk Identification Using Hidden-Layer Feature of Segmentation[J].Journal of Chinese Information Processing,2016,30(2):12-17.
Authors:LI Guochen  LIU Zhanpeng  WANG Ruibo  LI Jihong
Affiliation:1. School of Computer and Information Technology, Shanxi University, Taiyuan, Shanxi 030006, China;
   2. Department of Computer Engineering, Taiyuan Institute of Technology, Taiyuan, Shanxi 030008, China;
   3. Computer Center of Shanxi University, Taiyuan, Shanxi 030006, China)
Abstract:Based on the unit of Chinese character, a neural network learning model for Chinese base-chunk identification is constructed. The model combines the neural network learning model of segmentation task with the model of base-chunk identification by using the hidden-layer features of segmentation. The sentence-level likelihood function for base-chunk identification task is employed as the optimization target. The parameters of the two learning model are trained in turn. The experimental results show that: 1) the F-score of base-chunk identification with sentence-level likelihood function is 1.33% higher than that with character-level likelihood function, and especially, the recall for the multi-characters chunk identification is improved as much as 4.68%. 2) The final result of using hidden-layer features of segmentation task is 2.17% higher.
Keywords:distributed representation  Chinese base-chunk identification  neural network model  hidden-layer features  sentence-level likelihood function  
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号