首页 | 本学科首页   官方微博 | 高级检索  
     

基于半监督协同训练的百科知识库实体对齐
作者姓名:张伟莉    黄廷磊  梁霄
基金项目:国家高技术研究发展计划项目(2015AA7115028,2015AA7115061)
摘    要:针对传统实体对齐方法中的有监督学习算法依赖大量标注数据,以及特征表示不适用于百科知识库等问题,提出一种基于半监督协同训练的实体对齐方法。将实体对齐建模为一个带约束的二分类问题,充分利用实体名、属性、描述文本及其中的时间、数值等关键信息,组合生成多维特征;将特征划分为2个相对独立的视图,通过2个视图上分类器的协同训练,迭代地从未标注数据中学习同义实体的分布情况。在2个中文百科上的实验结果表明,使用半监督协同训练方法进行实体对齐的F1值达到84.3%,较其他方法效果最优,证明了其有效性和在百科知识库上的实用价值。

关 键 词:实体对齐   半监督   协同训练   特征表示   梯度提升决策树  
收稿时间:2017-12-26
点击此处可从《计算机与现代化》浏览原始摘要信息
点击此处可从《计算机与现代化》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号