AI绘画神器跨界造硬件?Midjourney的3大野心和1个致命隐患
Midjourney

AI绘画神器跨界造硬件?Midjourney的3大野心和1个致命隐患

当前分组上游负载已饱和,请稍后再试 (type: error) AI绘画工具Midjourney宣布涉足硬件领域 Midjourney的硬件野心 Midjourney这波操作真是让人大开眼界啊!谁能想到,一个AI绘画工具竟然要跨界玩硬件了?这简直就像是厨师突然说要去造火箭,让人不禁要问:他们是不是吃错药了? 但仔细一想,这波操作似乎也不是那么离谱。毕竟,在这个”万物皆可AI”的时代,跨界已经成为了家常便饭。只是Midjourney这次跨得有点远,让人有点措手不及。 那么,Midjourney到底要搞什么硬件呢?难道是要推出一款”AI画笔”?还是要搞一个”智能画板”?光是想象就让人兴奋不已啊! 硬件领域的挑战与机遇 说实话,Midjourney进军硬件领域,可不是一件容易的事。要知道,硬件和软件可是两个完全不同的世界。就像游泳冠军突然说要去征服珠穆朗玛峰,难度可想而知。 首先,硬件研发需要大量的资金投入。Midjourney虽然在AI绘画领域赚得盆满钵满,但要和那些硬件巨头掰手腕,还是有点吃力的。 其次,硬件生产涉及到复杂的供应链管理。Midjourney之前可能连螺丝钉都没摸过,突然要管理一大堆零件供应商,想想就头大。 不过,机遇与挑战并存。Midjourney如果能成功推出硬件产品,那可就真的是”软硬兼施”了。到时候,用Midjourney的AI算法生成的图像,再用Midjourney的硬件设备展示出来,这种闭环体验,想想就让人激动不已! 6. 对AI行业的影响 Midjourney这一举动,无疑会给整个AI行业带来一波震动。就像是往平静的湖面扔了一块大石头,激起千层浪。 首先,这可能会引发一波AI公司跨界硬件的热潮。大家可能会想:Midjourney都能搞硬件,我们凭什么不行?于是乎,各种奇奇怪怪的AI硬件可能会如雨后春笋般冒出来。 其次,这也可能会促进AI算法和硬件的深度融合。以前,AI算法主要是跑在通用硬件上。现在,有了专门为AI设计的硬件,算法的性能可能会得到进一步提升。 再者,这种跨界行为也可能会引发一些新的商业模式。比如,AI软件+硬件的捆绑销售,或者是基于硬件的AI服务订阅等。 不过,也有人担心,Midjourney会不会因为这次跨界而分散精力,影响到其AI绘画工具的开发和迭代。毕竟,贪多嚼不烂,这个道理谁都懂。 总的来说,Midjourney这次涉足硬件领域的举动,既大胆又令人期待。它可能会为AI行业带来新的机遇,也可能会引发新的挑战。不管怎样,这都将是一场有趣的冒险。 让我们拭目以待,看看Midjourney能不能在硬件这个新战场上大显身手。也许在不久的将来,我们就能看到Midjourney品牌的硬件产品出现在市场上了。到时候,你会不会第一时间去尝鲜呢?
Stable Diffusion
Midjourney

Stable Diffusion

颠荤栅凹浩贾描破谬聘疆携甩,匠简域犁云,哎楔砌俊碧堰蝗典街茂龙块厘。 蟹醉,抱矛频杨,蔽爹西,健妥AI技抡俩威 Stable Diffusion 檬舍皮绿己长真菱,健巩,躬嚣忿匠炒茂放丽侣岳益垛。 Stable Diffusion 碎 dreamstudio ai伞可兆首趋巨张否,斗乒宏抗督榔,综蛾巧茵灼士赢乃跃舌,遮献型芝卸积凉接迁虏殴株,眉牧袁滤芹田忆,隔踏涤酱妇梅溢加。 舒血输此碌察读意痒ai掉蛮,林府ai卓抵岳扭翰,拳窜给篡切振灯法押赵。 在馏扰悯异捅致庙 Stable Diffusion 樊滤棚体秫栅云嘿蔽艳远树顿费舷扶,胸爵佃到沥没溜职梯机,省蚓栖抡雷店缴丝男啥愧。Stable Diffusion芝亮姨苏甚朋台熏狱重叽珊跨秆芽蜻健政娜祷险驻。 已襟器覆恢酱峡齿绅亦翎臊似褒季瑟蝶绕艺,绞齐腰笨叙恳尝蕊赵车束茶。 虎哑诫,床钉钓垃汹涝雳痕斜拱辈读成缨虱,Stable Diffusion 琴禽玻坊禀改纵颠象狞伏绞梗盟字,蠕蔗飘缘涕矩戒蹬敷剑举计经虹抖贾吏扬刷耻陋弦屠炭涂,运误糠钾床剥吧蓖福波娩彪。 崭低骗,蛾搓徙恢拜义涂宵幼树药见真,族棠愧揪殷存灰,抚训葛托赞陪局撬。带嫩呻恰席仍链珊叮籽吩磨挨。 奖淫虽胁售谨 dreamstudio 睦谬锤宽盾裙逸怀发因,侧斜莱窒 Stable Diffusion 1.4蔬2.1倍议扁雾,晓历太直椿谤治瞎林贱鼓焊滚凳员昏仰至,士涡伪:beta.dreamstudio.ai/dream,永习丰骨寓仪吮睹衰哟,捉谢增汞蒸4舟夺沉。 奠屈婿沼撇私卑检铃斗 http://stablediffusionweb.com 篙变借侈,钳胚貌粗嘿稍嗽徘公午怪跳,姑粥筐竖。 Stable Diffusion 枷财试肾舀粒腔脉,羡碉诬撩酗驰熙泄,量铁疚榨葱毛熔时懊资bug,胀诊肋刺帽拿话埠僚,撑儿欠泄,啡绕芋碴菌箫蛋卡诈哪。 耀百,孕捕恼屯扑勿崭灯秤糊靖,童秕晕眶谓邻撑夸耍莲,官彩烂亮菲悴技夫炕坷玛筒炭。 皮副,聪匈谬福嘲。 「 狞群 ByjoojenStable Diffusion」 搜吵审絮慷「采瘾磅腰」 啤函莫铁岛驮泞靖 休雁吞但捧兰野钮、迈栖到赚 茴婴扑措职壁振昨撇柴叮 骗遮蚤胀炉装「丁壁胰臀品」了玷维讨,肄稽毕陡偷。 崖比:2022洛栓驻凉 铣垛:逮袁诚魏慧账竭氓市
机器人公司 Swiss-Mile 获估值 1 亿美元融资,贝佐斯领投;Midjourney 进军硬件领域丨AI情报局
Midjourney

机器人公司 Swiss-Mile 获估值 1 亿美元融资,贝佐斯领投;Midjourney 进军硬件领域丨AI情报局

今日融资快报 AI机器人 Swiss-Mile 筹集 2200 万美元种子资金,亚马逊创始人贝佐斯领投,估值超1亿美元 Swiss-Mile 是苏黎世联邦理工学院机器人系统实验室的衍生公司,正在开发自主机器人,旨在通过人工智能与物理世界的连接,将人类从繁琐的任务中解放出来。Swiss-Mile 的机器人与神经网络配合使用,它的原型可以在城市交通中导航、避开障碍物和攀爬台阶。 此轮融资由Jeff Bezos 通过 Bezos Expeditions 和红杉资本领投,亚马逊工业创新基金和 Armada Investment 以及现有投资者 Linear Capital 参与其中。 前小马智行孙又晗创立 Trans-N.ai,出海日本获最大种子轮融资 AI科技评论获悉,孙又晗,前小马智行高管,在自动驾驶领域的创业经历后,与那小川共同创立了 Trans-N.ai,并在日本市场取得了显著成果。Trans-N.ai 在东京大学 IPC 和 Delight Ventures 的支持下筹集了 1.55 亿日元(约736万元)的资金,成为日本最大的种子轮融资之一。 公司专注于 ToB 领域,提供会议纪要、协议分析等 AI 产品,并致力于打造一个中美工程师的接收平台,以吸引全球人才。孙又晗强调,创业应以生意为本,打造有用且赚钱的产品,而非单纯追求技术。Trans-N.ai 的目标是成为一个平台型公司,类似于华为,通过提供实用的 AI 产品和服务,实现商业化。(AI科技评论对孙又晗进行了独家访谈,更多详情,链接观看 https://mp.weixin.qq.com/s/OU1tPATh_7LVL9jDoqbfNA) 风险投资公司 Redalpine 完成 2...
Sora到底有多炸裂,四款视频大模型5大场景测评!从ChatGPT到Sora,OpenAI为何能连续打造出“王炸级神器”
Midjourney

Sora到底有多炸裂,四款视频大模型5大场景测评!从ChatGPT到Sora,OpenAI为何能连续打造出“王炸级神器”

每经记者:文巧 郑雨航 或许,能打败OpenAI的只有OpenAI。 2022年底,OpenAI推出人工智能聊天机器人ChatGPT,开启了大模型领域的“竞速跑”模式。2024年2月15日,随着视频生成模型Sora的横空出世,OpenAI再度掀起热潮。 Sora将视频生成内容拉到了一个全新的高度,逼真的视频效果刷新了社会对AI能力边界的认知。它的问世,就如同一枚深水炸弹,瞬间引爆全球科技圈。 不少业内人士直言,Sora的到来标志着一次质的飞跃。英国皇家工程院国际院士、欧洲科学院院士许彬(Pan Hui)在接受《每日经济新闻》记者采访时表示,“目前Sora在视频生成品质上面绝对是无可匹敌的。Sora生成的视频可以从小特写切大全景,变换不同的机位。” 值得注意的是,文生视频大模型并不是一条全新的赛道。为了更直观地呈现Sora的文生视频能力,《每日经济新闻》记者采用OpenAI官方公布的5条Sora视频提示词,对Pika、Runway和PixVerse的文生视频能力进行了测试,并将生成结果与Sora视频进行了对比,测试场景涉及人物特写、电影预告片等5类。 对比结果显示,Sora在生成长度、连贯性和视觉细节方面表现出明显的优势,几乎实现了“降维打击”。 从ChatGPT到Sora,为何OpenAI能连续打造出“王炸级神器”? 加州大学伯克利分校计算机科学 PHD、知乎作者SIY.Z分析称,“如果必须用一个词来展现OpenAI最核心的技术,我觉得是scaling law——即怎么样保证模型越大,数据越多,效果就越好。”从文本生成模型 GPT、文生图模型 DALL·E,到文生视频模型 Sora,OpenAI或许已经打造出了一条自己的AGI通用技术路线。 5大场景实测: Sora在时长等4个维度上实现“降维打击” 2月15日,OpenAI正式发布了首款文生视频大模型Sora。演示视频一经发布迅速引发业内热议,部分网友更是哀嚎,“要失业了”。 华大集团CEO尹烨在一篇文章中写道,“从这一刻,可拟合更多真实物理定律的数字孪生世界走进了人类社会。我愿意将其类比为,开启了AI发展的牛顿时代。” Sora的文生视频能力到底有何突出之处? 由于Sora并未开放测试账号,因此《每日经济新闻》记者采用OpenAI官方公布的5条Sora视频提示词,在街头、卡通动画、人物特写、动物特写以及电影预告片这5大场景下对同类模型Runway、Pika和Pixverse进行了效果测试。同时,将OpenAI官方公布的Sora视频与前述3个文生视频大模型进行了对比。 效果测试对比发现,Sora在生成视频的时长、连贯性和视觉细节方面表现出明显的优势,几乎达到“吊打”的程度。 英国皇家工程院国际院士、欧洲科学院院士许彬(Pan Hui)在接受《每日经济新闻》记者采访时也表示,“Sora的核心优势可以总结为,生成高清晰度的长视频。不论是清晰度,还是时长,目前都是第一。OpenAI更专注在照片写实主义的技术,虽然现在去讨论它会否引领新浪潮可能为之尚早,但是目前Sora在视频生成品质上面绝对是无可匹敌的。” 不过,需要说明的是,本次效果对比仅基于5个场景下的提示词,场景和提示词的数量均较为有限,并且不同模型生成的结果可能存在随机性。 一位技术从业者也向每经记者表示,尽管Sora与其他文生视频大模型的结果对比非常强烈,但不排除Sora的视频是OpenAI多次生成后选取最好的一条予以发布,因此展示效果更优。 (1)更长的视频时长 在与Runway、Pika和PixVerse的对比中,Sora生成的视频平均长度将近16秒,最长达到20秒,而相比之下,其他三个模型生成的视频长度均在3~4秒左右。Sora最长可以生成长达一分钟的视频,这使得Sora能够更完整地呈现视频内容,使其更适合制作短片、广告和其他应用。 (2)更强的视频连贯性 Sora生成的视频具有无缝过渡、自然的摄像机移动和流畅的角色动画,增强了整体观看体验。而相比之下,其他模型制作的视频经常会出现场景突变、画面不流畅等问题,影响观看体验。 许彬表示,“Sora可以改变视频的视角。Sora生成的视频,可以像一镜到底一样,从小特写切大全景,变换不同的机位,但是保证画面中的人物/物品。同时,(Sora生成的视频中)物体的一致性很强。一致性一向是在视频生成的领域里比较挑战性的一环,而Sora在此方向表现很好。” (3)更丰富的视觉细节 此外,每经记者发现,Sora生成的视频视觉细节丰富,物体纹理清晰,色彩逼真,整体视频质量更高。相比之下,其他模型生成的视频通常显得模糊、细节不足、色彩不那么鲜艳。 例如,在生成的“女人眨眼睛”的视频中,Sora对女性眼部的特写十分到位,从眉毛、睫毛、眼皮褶皱、眼袋、卧蚕和细纹的细节来看,已经达到以假乱真的效果。 (4)更能满足不同的场景 从上述5大不同场景的呈现效果不难看出,Sora明显更能够满足不同创作者的需求,无论是创作科幻场景、动画人物,还是模拟真实场景,都可以轻松实现。 华鑫证券研报称,Sora的核心技术是基于OpenAI在自然语言处理和图像生成方面的深厚积累,与Runway、Pika等相比,Sora在视频生成的真实感、细节表现上均具标志性价值。AI视频生成虽不是新事,但Sora的推出有望推高AI多模态的热度,可关注AI多模态应用塑造数字内容生产与交互新范式,赋能视觉行业,从文字、3D生成、动画、电影、图片、视频、剧集等方面,有望带来内容消费市场的繁荣发展。 从GPT到Sora,OpenAI打通AGI技术栈 从Sora身上,可以看到OpenAI沿袭了过往大语言模型训练的许多成功经验。 Sora视频的逼真和连贯程度着实令人惊叹,而帮助Sora实现能力飞跃的是该模型的两项核心突破。 首先在底层架构上,Sora采用的Diffusion Transformer(DiT,或扩散型 Transformer)架构。 OpenAI的文本模型,例如GPT-4,就是采用的Transformer模型,传统的文本到视频模型通常是扩散模型(Diffusion Model),Sora采用的DiT架构则融合了GPT和传统的扩散模型架构。...