首页 | 本学科首页   官方微博 | 高级检索  
     

混合生成式和判别式模型的图像自动标注
作者姓名:李志欣  施智平  张灿龙  王金艳
作者单位:广西师范大学计算机科学与信息工程学院, 桂林 541004;首都师范大学信息工程学院, 北京 100048;广西师范大学计算机科学与信息工程学院, 桂林 541004;广西师范大学计算机科学与信息工程学院, 桂林 541004
基金项目:国家自然科学基金项目(61165009,61262005,61363035,61365009);国家重点基础研究发展计划(973)项目(2012CB326403);广西自然科学基金项目(2012GXNSFAA053219,2013GXNSFAA019345,2013GXNSFBA019263,2014GXNSFAA118368)
摘    要:目的 由于图像检索中存在着低层特征和高层语义之间的“语义鸿沟”,图像自动标注成为当前的关键性问题.为缩减语义鸿沟,提出了一种混合生成式和判别式模型的图像自动标注方法.方法 在生成式学习阶段,采用连续的概率潜在语义分析模型对图像进行建模,可得到相应的模型参数和每幅图像的主题分布.将这个主题分布作为每幅图像的中间表示向量,那么图像自动标注的问题就转化为一个基于多标记学习的分类问题.在判别式学习阶段,使用构造集群分类器链的方法对图像的中间表示向量进行学习,在建立分类器链的同时也集成了标注关键词之间的上下文信息,因而能够取得更高的标注精度和更好的检索效果.结果 在两个基准数据集上进行的实验表明,本文方法在Corel5k数据集上的平均精度、平均召回率分别达到0.28和0.32,在IAPR-TC12数据集上则达到0.29和0.18,其性能优于大多数当前先进的图像自动标注方法.此外,从精度—召回率曲线上看,本文方法也优于几种典型的具有代表性的标注方法.结论 提出了一种基于混合学习策略的图像自动标注方法,集成了生成式模型和判别式模型各自的优点,并在图像语义检索的任务中表现出良好的有效性和鲁棒性.本文方法和技术不仅能应用于图像检索和识别的领域,经过适当的改进之后也能在跨媒体检索和数据挖掘领域发挥重要作用.

关 键 词:图像自动标注  概率潜在语义分析  多标记学习  分类器链  图像检索
收稿时间:2014-09-24
修稿时间:2015-01-14
点击此处可从《中国图象图形学报》浏览原始摘要信息
点击此处可从《中国图象图形学报》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号