多模态预训练:DALL-E
Midjourney

多模态预训练:DALL-E

先导知识 残差网络TransformerCLIP 前言 这里要介绍的DALL-E[1]是OpenAI的多模态预训练模型,它的最显著的效果是在文本到图像的生成上。一个例子是图1的DALL-E根据输入“牛油果形状的扶手椅”生成的图像,它足以达到以假乱真的效果,生成的内容不仅逼真合理,甚至可以一定程度上启发人类设计师。DALL-E通过120亿参数的模型,在2.5亿图像文本对上训练完成。它是一个两阶段的模型:它的第一个阶段是离散变分自编码器(Discrete Variance Auto-Encoder,dVAE),用于生成图像的token。它的第二个阶段是混合了图像和文本特征的,以Transformer为基础的生成模型。在DALL-E中,它使用了非常多优化模型准确率的技巧和提升训练效率的优化,下面我们来逐一介绍之。 图1:DALL-E根据输入“牛油果形状的扶手椅”生成的图像 1. 阶段1:离散变分自编码器 1.1 背景知识:变分自编码器 我们知道,由于图像特征的密集性和冗余性,它是不能直接提供给Transformer进行训练的。目前主流的方式,例如ViT,Swin-Transformer等都是将图像的Patch作为模型的输入,然后通过一个步长等于Patch大小的大卷积核得到每个Patch的特征向量。DALL-E提供的方案是使用一个离散的变分自编码器(dVAE)将大小为 256×256256\times256 的RGB图像压缩到大小为 32×3232\times32 的,通道数为 8,1928,192 的one-hot token的分布(注意这个one-hot的形式,它很重要),变分自编码器的架构如图2所示。换句话说,阶段1的作用是将图像映射到一个大小为 8,1928,192 的图表中。这里通道数为 8,1928,192 的one-hot向量可以看做是一个词表,它的思想和是通过离散VAE,实现图像特征空间想文本特征空间的映射。 图2:DALL-E阶段1使用的的离散变分自编码器 在深度学习中,变分自编码器(VAE)[2]和生成对抗网络(GAN)是最为常见的两个生成模型。提到VAE,则又不得不提自编码器(Auto-Encoder,AE),AE是一个常见的降维算法,它由编码器和解码器组成,编码器用于将输入 xx 压缩成信号 yy ,表示为 y=f(x)y = f(x) 。解码器用于将信号 yy 重构成内容 rr ,表示为 r=h(y)r = h(y) 。自编码器的误差定义为输入 xx 和重构内容 rr 的差值,它可以表示为式(1)。 (1)e=x−r=x−h(f(x))e...
Midjourney系列:迷人美女绝美摄影
Midjourney

Midjourney系列:迷人美女绝美摄影

原标题:Midjourney系列:迷人美女绝美摄影 迷人美女的容颜、神态和气质都能够吸引着摄影师们的眼球,成为相机镜头中最耀眼的存在。迷人美女的绝美摄影,不仅仅是记录美的表面,更是在镜头下展现内心世界的一种表达。 在摄影师的镜头中,美女可能是一个独特的侧颜,也可能是一双明亮的眼眸,抑或是一个动人的微笑。每一位美女都有着属于自己的魅力所在,而摄影师则需要用心去捕捉这些细微之处,将其完美地呈现在画面中。 光影是摄影中不可或缺的元素之一,而对于迷人美女的摄影来说,更是至关重要的。柔和的自然光可以为美女的肌肤带来丝丝柔美,而适当的侧光则能够突出她们的轮廓和线条,让画面更加有层次感。此外,利用逆光或背光拍摄,能够营造出一种梦幻般的效果,为迷人美女增添一份神秘感。 构图是摄影中的基础,而对于迷人美女的摄影来说,更需要考虑到构图的美感和动感。在构图上,可以采用黄金分割、对称构图或是留白构图等方式,来突出美女的主体地位,并营造出一种平衡和和谐的画面。此外,选择合适的拍摄角度也至关重要,有时候低角度能够凸显美女的气势,而高角度则能够展现她们的柔美和娇俏。 摄影作为一门艺术,更需要在技术的基础上融入情感的表达。在迷人美女的摄影中,摄影师需要通过表情、眼神和姿态等方面,来传递出美女内心世界的情感。或是一种温柔的眼神,或是一抹妩媚的微笑,抑或是一丝忧郁的神情,都能够让观者在画面中感受到一种共鸣和情感共振。通过文字的叙述和描绘,能够为观者呈现出一幅幅美丽的画面,让他们仿佛置身于其中,感受到美的力量和魅力。 在迷人美女绝美摄影中,细节的关怀至关重要。每一个微笑的弧度,每一缕飘逸的发丝,甚至是眼角的泪痕,都是构成美的不可或缺的元素。摄影师需要用心去观察、去捕捉这些细微之处,因为正是这些看似不起眼的细节,才能够让画面更加生动、更加有故事感。 除了捕捉美女本身的魅力,情境的营造也是迷人美女绝美摄影中的重要一环。通过选取合适的拍摄场景和布置道具,能够为画面增添一份情感的氛围和故事的内涵。或是在阳光明媚的午后,或是在雨夜寂静的街头,抑或是在浪漫的花海中,每一个情境都能够为美女的形象增添一份神秘和诱惑,让观者不禁沉浸其中。 摄影师可以尝试各种不同的拍摄手法和后期处理技巧,来为画面增添一份独特的韵味和个性化的风格。或是采用黑白摄影的方式,突出画面的层次感和质感,抑或是运用特殊的滤镜效果,营造出一种梦幻般的氛围,都能够为迷人美女的形象增添一份独特的魅力。 返回搜狐,查看更多 责任编辑:
原创
            Midjourney系列:美女海边写真-马尔代夫绝美摄影
Midjourney

原创 Midjourney系列:美女海边写真-马尔代夫绝美摄影

拍摄海边美女写真需要综合考虑自然光线、模特的姿态、服装、背景以及摄影技术等多方面因素。 拍摄技巧:时间选择、选择合适的背景、模特姿态和表情、利用反射和剪影、视角和构图。 早晨和傍晚的柔和光线非常适合拍摄美女写真,尤其是在金色时段和蓝色时段。 选择清澈的海水、柔滑的沙滩、或者飘动的海风作为背景,以营造自然、舒适和浪漫的氛围。 指导模特采取自然、优雅的姿态和表情,同时确保模特与背景环境的和谐融合。 选择与海边环境相协调的服装和造型,比如轻盈的裙子、帽子和太阳眼镜等。 利用海水的反射和日落时的剪影效果,创造独特的视觉效果。 尝试不同的拍摄角度和构图,如低角度、高角度和侧面视角等,寻找最佳的拍摄视点。 参数设置建议: 光圈(Aperture):使用大光圈(例如 f/1.4, f/2, f/2.8)来创建浅景深效果,突出模特而让背景虚化。 快门速度(Shutter Speed):根据光线条件和拍摄需求调整,通常可以保持在1/200秒或更快,以确保清晰锐利的图像。 ISO:保持低 ISO(例如 ISO 100 或 200)以获得最低的噪点和最好的图像质量,如果光线不足,可以适当提高 ISO。 白平衡(White Balance):根据光线条件选择合适的白平衡设置,或者在后期调整。 对焦:确保模特的眼睛或者重要的特征清晰对焦。 镜头选择:使用中长焦镜头(例如 85mm 或 135mm)可以得到很好的人像效果,并且可以避免广角镜头的畸变。 使用反光板或柔光箱:如有可能,使用反光板或柔光箱帮助改善光线,使模特的皮肤看起来柔和。 每次拍摄都是一个学习和实践的过程,不断尝试和调整,分析拍摄结果,以提高拍摄技术和审美。同时,也可以考虑学习和参考其他专业摄影师的作品和技巧,以丰富自己的拍摄经验和创意。 返回搜狐,查看更多 责任编辑:
Midjourney提示词——《环太平洋》机甲专场(附公式)
Midjourney

Midjourney提示词——《环太平洋》机甲专场(附公式)

本篇为大家带来《环太平洋》的机甲提示词,文末附公式 1、危险流浪者 Gypsy Danger, standing tall and heroic, dramatic lighting highlighting the metal plates, deep blue and silver color scheme, in battle-ready stance, city ruins in the background, sparks flying, dusk sky, intense atmosphere 危险流浪者,站得高大而英勇,戏剧性的灯光突显金属板,深蓝色和银色配色,战斗准备姿态,背景是城市废墟,火花飞溅,黄昏的天空,紧张的气氛 2、尤里卡突袭者 Striker Eureka, launching a missile with both arms extended, sleek...