简介
OpenAI 的文本生成模型 DALL-E 2 一经推出,就在社交媒体上引起了轰动,我当时正为即将轮到本人的团队技术分享寻找主题,分享内容可以跟自己项目毫无关系,于是我选择了分享文本生成模型 DALL-E 2,从原始论文延展到相关技术细节,读了大量论文和网络技术分享。准备这个分享时是七八月份,但因为疫情原因不断居家办公,最终在公司分享时已经到了 12 月底,ChatGPT 都已经发布了,好在最终圆满完成任务。
下面是分享的PPT转成了图片,当时忙中偷闲所做,就这样了。
幻灯片



































参考文献
- 带你深入理解扩散模型DDPM
- 大火的扩散模型看不懂?谷歌大佬用统一视角讲明白了
- 木遥微博 目前 AI 绘画的现状、入口、困难
- 木遥微博
- 阿文微博 AI绘画工具
- clip
- AI艺术的背后:详解文本生成图像模型
- Generalized Visual Language Models
- What are Diffusion Models?
- Contrastive Representation Learning
- 与 Midjourney 主创对谈
- Understanding VQ-VAE (DALL-E Explained Pt. 1)
- How is it so good ? (DALL-E Explained Pt. 2)
- DALL·E 2解读-结合预训练CLIP和扩散模型实现文本-图像生成
- Text-to-image model
- 什么是diffusion模型