首页 | 本学科首页   官方微博 | 高级检索  
     

从隐空间认识CLIP多模态模型
引用本文:高焕堂.从隐空间认识CLIP多模态模型[J].电子产品世界,2023(5):8-9+16.
作者姓名:高焕堂
作者单位:铭传大学;长庚大学
摘    要:<正>1前言AIGC可生成的内容形式包含文本(文句)、图像、音频和视频。它能将文本中的语言符号信息或知识,与视觉中可视化的信息(或知识)建立出对应的关联。两者互相加强,形成图文并茂的景象,激发人脑更多想象,扩大人们的思维空间。其中,最基础的就是文本(Text)与图像(Image)之间的知识关联。本篇来介绍文本与图像的关联,并以CLIP模型为例,深入介绍多模态AIGC模型的幕后架构,

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号