首页 | 本学科首页   官方微博 | 高级检索  
     

iMakeup:特定领域的大规模长视频数据集——用于细粒度视频语义内容描述
引用本文:林霄竹,金琴,陈师哲.iMakeup:特定领域的大规模长视频数据集——用于细粒度视频语义内容描述[J].计算机辅助设计与图形学学报,2019,31(8):1350-1357.
作者姓名:林霄竹  金琴  陈师哲
作者单位:中国人民大学信息学院多媒体计算实验室 北京 100872;中国人民大学信息学院多媒体计算实验室 北京 100872;中国人民大学信息学院多媒体计算实验室 北京 100872
基金项目:国家自然科学基金;国家重点研发计划
摘    要:实际生活中,大多数视频均含有若干动作或物体,简单的单句描述难以展现视频中的全部信息,而各类长视频中,教学视频步骤清晰、逻辑明确,容易从中提取特征并使用深度学习相关算法进行实验验证,从长视频中提取复杂信息成为研究人员日益关注的问题之一.为此,文中收集整理了一个命名为iMakeup的大规模的美妆类教学视频数据集,其包含总时长256 h的热门50类2000个长视频,以及12823个短视频片段,每个片段均根据视频的逻辑步骤顺序进行划分,并标注起止时间和自然语句描述.文中主要通过视频网站下载收集原始视频,并请志愿者对视频的详细内容进行人工标注;同时统计分析了此数据集的规模大小和文本内容,并与其他类似研究领域的若干数据集进行对比;最后,展示了在此数据集上进行视频语义内容描述的基线实验效果,验证了此数据集在视频语义内容描述任务中的可行性.iMakeup数据集在收集整理时注重内容多样性和类别完整性,包含丰富的视觉、听觉甚至统计信息.除了基本的视频语义内容描述任务之外,该数据集还可用于视频分割、物体检测、时尚智能化推荐等多个前沿领域.

关 键 词:大规模数据集  美妆  视频语义内容描述  视频分割

iMakeup:Makeup Instructional Video Dataset for Fine-Grained Dense Video Captioning
Lin Xiaozhu,Jin Qin,Chen Shizhe.iMakeup:Makeup Instructional Video Dataset for Fine-Grained Dense Video Captioning[J].Journal of Computer-Aided Design & Computer Graphics,2019,31(8):1350-1357.
Authors:Lin Xiaozhu  Jin Qin  Chen Shizhe
Affiliation:(Multimedia Computing Laboratory,School of Information,Renmin University of China,Beijing 100872)
Abstract:Lin Xiaozhu;Jin Qin;Chen Shizhe(Multimedia Computing Laboratory,School of Information,Renmin University of China,Beijing 100872)
Keywords:large-scale dataset  makeup  video caption  video segmentation
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号