从隐空间认识CLIP多模态模型期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

从隐空间认识CLIP多模态模型

引用本文：	高焕堂.从隐空间认识CLIP多模态模型[J].电子产品世界,2023(5):8-9+16.

作者姓名：	高焕堂

作者单位：	铭传大学;长庚大学

摘要：	<正>1前言AIGC可生成的内容形式包含文本(文句)、图像、音频和视频。它能将文本中的语言符号信息或知识,与视觉中可视化的信息(或知识)建立出对应的关联。两者互相加强,形成图文并茂的景象,激发人脑更多想象,扩大人们的思维空间。其中,最基础的就是文本(Text)与图像(Image)之间的知识关联。本篇来介绍文本与图像的关联,并以CLIP模型为例,深入介绍多模态AIGC模型的幕后架构,