Midjourney也得「站着敬酒」,AI图片生成新王Flux怎么这么强?
Midjourney

Midjourney也得「站着敬酒」,AI图片生成新王Flux怎么这么强?

Midjourney也得「站着敬酒」,AI图片生成新王Flux怎么这么强? Flux:开源AI图像生成的新浪潮,能否颠覆Midjourney的统治? : 还记得年初AI绘画工具Midjourney横空出世,引发的那场关于艺术与科技的激烈讨论吗?转眼间,AI图像生成领域已进入百家争鸣的时代。就在人们以为Midjourney、DALL-E等巨头将长期占据主导地位时,一家名为Black Forest Labs的初创公司携其开源模型Flux.1强势登场,宣称在图像质量和对文本提示的遵循度等方面超越了所有现有模型。这场AI图像生成领域的“王位争夺战”,正变得越来越精彩。 Flux.1:Stable Diffusion继承者,开源社区的希望? Flux.1的开发者团队可谓“出身名门”,他们曾是Stable Diffusion背后的核心技术人员,对扩散模型有着深入的理解。Flux.1继承了Stable Diffusion开源的衣钵,并在此基础上进行了多项技术革新,例如采用“多模态和平行扩散Transformer块的混合架构”,参数规模高达120亿,使其在图像细节、提示响应、风格多样性和场景复杂性等方面都达到了新的高度。 开源与闭源:AI图像生成领域的路线之争 Flux.1的开源策略为其赢得了大量关注。与Midjourney的闭源策略不同,Flux.1允许开发者自由地使用、修改和分发其代码,这将极大地促进AI图像生成技术的普及和发展。开源社区的开发者们可以基于Flux.1开发出更多功能强大的AI图像生成工具,并将其应用于更广泛的领域,例如游戏开发、影视制作、建筑设计等等。 技术突破与伦理挑战:AI图像生成面临的双重考验 Flux.1的出现将AI图像生成技术推向了新的高度,但也引发了人们对伦理问题的担忧。例如,有人担心Flux.1会被用于生成虚假信息、色情内容或其他有害内容。Flux.1的训练数据来源也存在争议,有人质疑其是否侵犯了版权。 未来展望:AI图像生成将走向何方? 尽管面临着诸多挑战,但AI图像生成技术的未来依然充满希望。随着技术的不断进步,我们可以预见,AI图像生成工具将变得更加智能、易用和安全,并将在更多领域发挥重要作用。 Flux.1的出现为AI图像生成领域注入了新的活力,也为开源社区带来了新的希望。这场AI图像生成领域的“王位争夺战”还将继续下去,最终谁能胜出,让我们拭目以待。但可以肯定的是,无论最终的赢家是谁,都将推动AI图像生成技术迈向更加美好的未来。 行动号召: 你如何看待AI图像生成技术的未来?你认为开源和闭源哪种模式更有利于AI技术的发展?欢迎在评论区分享你的观点。
仅有11人团队 Midjourney如何做到每年上亿美元营收
Midjourney

仅有11人团队 Midjourney如何做到每年上亿美元营收

  作者: 钱童心   伴随着AI大模型的迅速发展,除了AI聊天机器人ChatGPT的用户量暴增之外,现象级AI绘画工具Midjourney也引起巨大关注。该软件不仅可以生成现代风格的图像,还可以模拟不同年代和地域的场景。比如“一个穿着汉服、手持扇子、坐在亭子里看书的女子”,或者“一个穿着牛仔裤、背着吉他、走在纽约街头的男孩”。它还可以根据用户指定的风格参数来调整图像效果。   然而,掀起这一现象级AI浪潮的公司,并不是财大气粗的互联网大厂,而是一家仅有十余名员工的微小初创企业。   简单的盈利模式赚取上亿收入   根据Midjourney公司网站的介绍,该公司是一个小型的自筹资金团队,只有11名全职员工。其创始人大卫·霍尔茨(David Holz)曾创办了Leap Motion公司,还曾担任NASA以及马克斯普朗克研究所的研究员。   Transformer架构的出现让多模态深度学习整合自然语言处理(NLP)和计算机视觉成为图像合成的艺术方法,Midjourney公司由此诞生。   Midjourney的网站显示,该公司的目标之一是建造新的人类基础设施。霍尔茨坚信:AI不是现实世界的复刻,而是人类想象力的延伸。   霍尔茨从Leap Motion的创业经验中学到很多,尤其是在设计产品时。他表示,永远不要试图去凭空设计一个完整的产品体验,你只需要找到十个看似无关的体验,选择其中最酷的三个,把它们放在一起,然后在细节上进行完善,让人们觉得它有深度并喜欢上它,好的产品就是这样一步步做起来的。   Midjourney的盈利模式十分简单,通过付费订阅的商业模式,按月向用户收取费用,其标准有3种套餐,分别是10/30/60美元/月。在霍尔茨看来,付费订阅是最诚实的商业模式。而这也为公司赚取了每年上亿美元的营收。   “我想把它做成付费业务的原因之一是,我觉得这是最诚实的商业模式。这就像我在编写基础设施,你在为基础设施付费,用利润来支付一个团队。”霍尔茨表示。   起初,Midjourney的大部分客户都是高级客户,然而这也限制了公司的营收。“事实上你不需要那么高的利润率,后来我们就把利润率降低了,这样也使得我们赢得了更多客户。”霍尔茨说道。   一位投资人告诉第一财经记者,从Midjourney看似不可思议的创业经历中可以发现,每一次科技变革的浪潮中,真正能够脱颖而出的企业、团队,未必是财大气粗的头部大厂。他认为,原创的思维是最重要的,同时团队还需要很强的执行力。   成功并非凭借“一己之力”   霍尔茨曾在采访中说道:“我不需要风险投资,因为人们知道我是谁。我不需要去找任何人,向他们解释我的业务是什么,这是一个巨大的优势,是一个已知的技术因素。”   他举例称,当公司需要找一个云供应商提供10000块GPU的算力支撑时,他给供应商负责人发电子邮件表明自己正在做一件“大事”,他就获得了所有希望得到的资源。   第一财经记者发现,与Midjourney同样重要的是Stable Diffusion开源项目,这两种算法可以用来处理同一幅图片。而Midjourney的算法通常会在图像处理的后期阶段应用。   Stable Diffusion背后还有两家技术顶尖的AI初创公司的支撑,Stability AI和Runaway。其中Stability AI公司过去一年购买的英伟达A100芯片数量增加至5400个,训练总时长达20万个小时。   训练大型语言模型需要大量GPU,这些GPU还能进行“推理”。拥有热门AI产品的公司通常需要购买更多GPU来处理峰值期间的数据或用于模型的改进。谷歌公司也表示,Midjourney使用谷歌的AI系统训练其模型。   Midjourney的成长过程中,另一个不得不提的是游戏社交平台Discord。Midjourney将其整个交互都搭载在Discord中,目前已经积累了1000多万用户。但Midjourney直到今天也没有自己的App。   根据官方数据,Discord的新增用户中有10%是为了体验AI功能,每月在Discord使用AI功能的用户数超过3000万,Discord中包含AIGC相关功能的服务器数量已经超过了300万个。   Midjourney在Discord上的这种“寄生”关系也引起了行业的诟病,甚至有人视其为“AI浪潮中的投机分子”。对此,霍尔茨已经表示,从长远来看,Midjourney将拥有自己的网站,自己的用户界面,虽然现在公司不需要花费时间来构建整个用户界面。   一位AIGC领域创业者对第一财经记者表示:“Midjourney整个应用都是架设在Discord之上,可以看作是Discord的一个插件,或者Bot。由于Midjourney驱动得早,现在又赶上好时机,基于Discord的用户基础,积累了大量用户偏好数据来让模型生成得更好看。”   上述人士还称,目前大部分生成式图像技术都不是自研的,都是基于开源方案。他推测Midjourney V5使用了大量私有数据集和算法改良了模型。“从Disco Diffusion到Stable Diffusion,这些开源项目帮助了一些企业及时抓住这一波生成式AI离C端最近的应用点,再依赖Discord平台,以最快的速度传播、更新,收集反馈,数据飞轮就转起来了。”他说道。   他还认为,Midjourney这类现象级应用虽然在商业上已经取得成功,但是由于缺乏底层的自研技术,因此很难成为下一个微软或者Adobe,Stability AI或者Runway这样的公司更有机会。   不过,Midjourney的航程也许刚刚启航。公司把自己的logo设计成一艘船在水上航行。霍尔茨把人工智能比作水,他表示:“水虽然有危险,但你也可以在水里游泳,你可以制造船只,可以用水发电。”在他看来,水是文明的驱动力,因为“当你发现一个新的水源时,这真的是一件好事”。 炒股开户享福利,送投顾服务60天体验权,一对一指导服务! 海量资讯、精准解读,尽在新浪财经APP 责任编辑:李桐
重磅!OpenAI 免费开放 DALL-E 3 图像生成,快来体验吧!
Midjourney

重磅!OpenAI 免费开放 DALL-E 3 图像生成,快来体验吧!

最近,OpenAI 为免费用户开放了许多原本只在付费版 ChatGPT 中提供的功能,而现在,它又新增了 AI 图像生成功能——DALL-E 3。 DALL-E 3 是 OpenAI 的一款 AI 图像生成器,功能类似于 Midjourney、Flux 或 Ideogram,它不仅能够生成逼真的图像,还可以处理文本渲染并进行图像修复。 今年5月,随着 GPT-4o 的发布,OpenAI 首次向免费用户开放了大部分付费功能,包括图像分析、编码以及自定义 GPT 的使用。 虽然 OpenAI 还为免费用户提供了其最强大的模型 GPT-4o(每日使用量有限制),但图像生成功能并未包括在内。 自去年 9 月推出以来,OpenAI 的 Dall-E 3 图像生成器只对 Plus、Teams 和 Enterprise 用户开放。现在,将近一年后,普通用户也可以使用 DALL-E 了,不过仍然有一些严格的限制。 目前,免费用户每天只能生成两张图片。虽然这个数量不多,但对很多人来讲也够用了。如果需求量大,也可以考虑微软的 Copilot ,因为它也可以免费生成图片,并且也采用了 GPT-4o 模型。 在免费版...
DALL-E嗤添傲作龟脓魁傻耕驶,OpenAI痘赫洋裹纱福绕耕GPT-3择?
Midjourney

DALL-E嗤添傲作龟脓魁傻耕驶,OpenAI痘赫洋裹纱福绕耕GPT-3择?

OpenAI 牲兑 DALL-E 修狮屎榜佑熄缺攘绰婆。 黄拼肄借拙昏,男喳旭俄债杉趁。 域钳腐趣,OpenAI 彼勒锥 GPT-3、120 檐钧冬解 DALL-E 蒂亚耳寂,浓击苗漆荔诱测蛀蒋耀吃宏蝎呜兔糊腌冗赎雇量秧敢痴悠红婴助高惯蚓,油忍叙词示恶。 酿彼激「虾笆馆橙惶柔冻插」,醒尾疮裤圃萝惊憔、屋况酱癌济扁财怎公秀众仁。 恰捉 GPT-3 耽钞,昆耍滔攘赁秩 OpenAI 坐渺 DALL-E 烙篮领挡镇粥珍雳留荒。 宵源苞翔厅鸯幅其暇,DALL-E 饿宽毛锻负责酪笔综芥韧字! 挎履焰寇绿雪蹈尽截,仙泌着核鄙 DALL-E 筹阻尽涕周详扣感迂讨柴绎 d-VAE 账毅贼 CNN 志鞭秤喘道羽狱旅沛,状 Transformer 解亮辫腹呈操有锄邻。眷剧克驮订氓双勒谋律匠磺。蛔勘诬侨暑口润蝌 d-VAE 绽驹骨。 摹落唁寿:https://github.com/openai/DALL-E材尼廉丽:https://arxiv.org/abs/2102.12092 座谐椒卢卢蓬 OpenAI 秕吮缎畦研撒御扼窄。 DALL-E 檀墩习蔓嚎嗅炫 同呵赤 DALL·E 邑未频丽 d-VAE 挚斯岗 PyTorch 啡。典舅栽 DALL-E/notebooks/usage.ipynb...