AI公司Midjourney透露新形态硬件产品的预告
Midjourney

AI公司Midjourney透露新形态硬件产品的预告

#头条首发大赛 快速导读Midjourney,知名的AI图像生成公司,近日宣布进军硬件开发,邀请求职者加入新部门。创始人大卫·霍尔茨拥有硬件背景,曾任Leap Motion CTO,并邀请前同事阿哈迈德·阿巴斯担任硬件项目负责人,阿巴斯在苹果公司有五年经验,参与Vision Pro耳机开发。尽管尚未明确硬件类型,Midjourney在社交媒体上与科技爱好者互动,暗示即将推出的设备“不会是挂件”,并表示正在进行多个项目,未来有更多可能性。霍尔茨曾提到受奇幻元素启发的“球体”概念,但需谨慎对待这些想法。目前尚无具体时间表,意味着我们可能需要等待一段时间才能见到该公司的硬件成果。 Midjourney的新硬件探索 Midjourney,这家以其先进的AI图像生成工具而闻名的公司,近日公开宣布其进军硬件开发的计划。该消息今天早些时候在公司官方的X账号上发布,邀请求职者申请这一新硬件部门的职位。这一举措标志着公司在探索超越软件的新技术领域时,迈出了重要的一步。 硬件领域的领导与专业 Midjourney的创始人大卫·霍尔茨(David Holz)拥有硬件开发的背景,曾担任Leap Motion的首席技术官(CTO)。最近,他邀请了前Leap Motion同事阿哈迈德·阿巴斯(Ahmad Abbas)来领导硬件项目。阿巴斯在苹果公司担任硬件经理五年,参与了Vision Pro耳机的开发,拥有丰富的经验。他在LinkedIn上的当前职位标注为“Midjourney硬件负责人”。 猜测与未来计划 虽然关于Midjourney计划开发的硬件类型仍不明确,但该公司在其X账号上积极互动,提供了一些可能引发科技爱好者兴趣的线索。例如,他们澄清即将推出的设备“不会是挂件”,尤其是在其他公司推出类似挂件的AI硬件设备屡遭失败之后。此外,Midjourney表示他们正在进行“多个项目”,并且“绝对有更多形态的机会”。尽管霍尔茨曾调侃创造一个受奇幻元素启发的“球体”的想法,但对这些声明应持谨慎态度,因为该公司和霍尔茨在社交媒体上的互动一向充满玩乐。目前尚未提供时间表,这意味着我们可能需要一段时间才能看到这一硬件探索的成果。
18种 DALL-E 3 炫酷的文字效果和提示词
Midjourney

18种 DALL-E 3 炫酷的文字效果和提示词

在图片上添加文字不仅可以传达信息,还可以吸引观众的注意力。DALL-E 3 不仅可以在图片上生成文字,还可以把文字巧妙地融合到图像中。这种自然而然的效果让很多设计师都望尘莫及。 虽然在提示词中告诉 DALL-E 3 要添加的文本,生成的效果也经常让我感到惊喜。但我会不由自主地想,是否能够自定义文字的效果,让 DALL-E 3 更懂我的心意呢?在各种试错之后,我终于总结出了这 18 种效果,希望能给正在阅读本文的你带来一些灵感。PS: 它目前还无法生成中文。 如果你还没有用过 ChatGPT 中的 DALL-E 3的话,可以看看这篇文章: 👉重磅!ChatGPT 可以进行 AI 绘图了,来看教程吧 # 叠加 Prompt:  [image prompt], with text [text] overlaid, prominent and aligns with the images style. 提示词: [图像提示词],并叠加文本[文本],突出并与图像样式保持一致。 范例:粉彩绘画:柔和的粉彩渲染出一片花田,娇嫩的花瓣在微风中摇曳,”宁静 “的文字叠加在上面,非常突出,与图片风格一致。 示例:水彩画:夜幕下的繁华都市景象,被迷人的烟花表演照亮,”活力 “字样叠加在画面上,非常突出,与画面风格一致。 # 以下/以上 Prompt:...
推荐收藏!Midjourney的10种可爱儿童插画风格(含提示词)
Midjourney

推荐收藏!Midjourney的10种可爱儿童插画风格(含提示词)

大家好, 小编将分享10个制作儿童插画的Midjourney的风格提示词。 在使用 Midjourney 的过程中,这些关键词也可以运用到提示词中,可以让儿童插画的色彩更丰富,风格更可爱。 Cute 可爱, Kawaii 卡哇伊, Vibrant 鲜艳, Bright colors 明亮的色彩, Nursery art 幼儿艺术, Plush doll art 毛绒娃娃艺术, Dreamlike illustration 梦幻般的插图, Adorable Vibe 可爱的氛围, 1.鲜花风格 A ramadhan festival poster in a kid’s cartoon art, in the style of vibrant florals, happiness, celebration, minimalist...
DALL-E
Midjourney

DALL-E

  DALL-E是一种专注于从文本描述生成图像的深度学习的模型。该模型能够在没有针对特定任务的额外训练的情况下,直接根据文本生成图像。由openAI发布,参数量达到了120亿,被称为“图像版GPT-3” 原理:   DALL-E 的核心是使用Transformer架构,将文本描述和图像数据结合起来进行联合训练。模型通过学习文本与图像之间的对应关系,能够理解文本中的语义信息,并生成符合这些描述的图像。 方法: DALL-E在VQ-VAE-2(先训练一个codebook,然后又训练一个pixel CNN做生成)基础上进行改进,生成模型部分用GPT替换pixel CNN,用文本引导图像生成。 训练时,输入图像文本对,文本部分通过BPE编码,得到M=256维特征;图像(256×256)经过dVAE获取N=32×32维codebook作为1024维图像特征;然后将图像和文本特征cocat起来(1024+256=1280)作为一个序列送入GPT,训练时进行mask然后预测生成即可。 推理时,只提供文本,然后用文本特征经过GPT用自回归的方式将图像生成出来。推理时会生成多张图像候选,使用CLIP模型进行排序,最终输出生成的图片和文本最贴切的个体。 模型结构:   DALL-E包括三个独立训练得到的模型:dVAE,Transformer和CLIP,其中dVAE的训练与VAE基本相同,Transformer采用类似GPT-3的生成式预训练方法。 数据集:DALL-E 使用了大规模的图文配对数据集进行训练。这些数据集包含了各种各样的图像及其对应的文本描述,使得模型能够学习到多样化的视觉概念和语言表达。 编码器-解码器结构:模型采用了编码器-解码器架构。文本输入经过编码器处理后,生成一个高维的特征表示。然后,这些特征通过解码器生成相应的图像。 自回归生成:DALL-E 使用自回归的方法生成图像。基于之前生成的部分和输入的文本信息,模型逐步生成图像的每个部分。 zero-shot学习:DALL-E通过在训练过程中学习到的广泛的知识和概念,能够在没有针对特定任务的训练数据情况下直接生成图像。 特点: 多样性:DALL-E能够生成多种风格和内容的图像,展示出强大的创造力和多样性。 灵活性:模型能够理解用户输入的任意文本描述,生成相应的图像。这种灵活性使得DALL-E在艺术创作、设计、广告等领域具有广泛的应用潜力。 高质量生成:生成的图像通常具有较高的清晰度和细节,能够准确反映文本描述中的信息。 概念组合能力:DALL-E 可以将不同的概念结合在一起生成新的图像,例如“一个穿着宇航服的猫”。   总之,DALL-E 的研究展示了深度学习在图像生成领域的巨大潜力,并为未来的研究和应用提供了新的思路。 ‍参考:Zero-Shot Text-to-Image Generationhttps://arxiv.org/pdf/2102.12092