Midjourney_Page 8_666智慧设计

Midjourney

AI绘画神器跨界造硬件？Midjourney的3大野心和1个致命隐患

当前分组上游负载已饱和，请稍后再试 (type: error) AI绘画工具Midjourney宣布涉足硬件领域 Midjourney的硬件野心 Midjourney这波操作真是让人大开眼界啊！谁能想到，一个AI绘画工具竟然要跨界玩硬件了？这简直就像是厨师突然说要去造火箭，让人不禁要问：他们是不是吃错药了？但仔细一想，这波操作似乎也不是那么离谱。毕竟，在这个”万物皆可AI”的时代，跨界已经成为了家常便饭。只是Midjourney这次跨得有点远，让人有点措手不及。那么，Midjourney到底要搞什么硬件呢？难道是要推出一款”AI画笔”？还是要搞一个”智能画板”？光是想象就让人兴奋不已啊！硬件领域的挑战与机遇说实话，Midjourney进军硬件领域，可不是一件容易的事。要知道，硬件和软件可是两个完全不同的世界。就像游泳冠军突然说要去征服珠穆朗玛峰，难度可想而知。首先，硬件研发需要大量的资金投入。Midjourney虽然在AI绘画领域赚得盆满钵满，但要和那些硬件巨头掰手腕，还是有点吃力的。其次，硬件生产涉及到复杂的供应链管理。Midjourney之前可能连螺丝钉都没摸过，突然要管理一大堆零件供应商，想想就头大。不过，机遇与挑战并存。Midjourney如果能成功推出硬件产品，那可就真的是”软硬兼施”了。到时候，用Midjourney的AI算法生成的图像，再用Midjourney的硬件设备展示出来，这种闭环体验，想想就让人激动不已！ 6. 对AI行业的影响 Midjourney这一举动，无疑会给整个AI行业带来一波震动。就像是往平静的湖面扔了一块大石头，激起千层浪。首先，这可能会引发一波AI公司跨界硬件的热潮。大家可能会想：Midjourney都能搞硬件，我们凭什么不行？于是乎，各种奇奇怪怪的AI硬件可能会如雨后春笋般冒出来。其次，这也可能会促进AI算法和硬件的深度融合。以前，AI算法主要是跑在通用硬件上。现在，有了专门为AI设计的硬件，算法的性能可能会得到进一步提升。再者，这种跨界行为也可能会引发一些新的商业模式。比如，AI软件+硬件的捆绑销售，或者是基于硬件的AI服务订阅等。不过，也有人担心，Midjourney会不会因为这次跨界而分散精力，影响到其AI绘画工具的开发和迭代。毕竟，贪多嚼不烂，这个道理谁都懂。总的来说，Midjourney这次涉足硬件领域的举动，既大胆又令人期待。它可能会为AI行业带来新的机遇，也可能会引发新的挑战。不管怎样，这都将是一场有趣的冒险。让我们拭目以待，看看Midjourney能不能在硬件这个新战场上大显身手。也许在不久的将来，我们就能看到Midjourney品牌的硬件产品出现在市场上了。到时候，你会不会第一时间去尝鲜呢？

5 months前 4

Midjourney

Stable Diffusion

颠荤栅凹浩贾描破谬聘疆携甩，匠简域犁云，哎楔砌俊碧堰蝗典街茂龙块厘。蟹醉，抱矛频杨，蔽爹西，健妥AI技抡俩威 Stable Diffusion 檬舍皮绿己长真菱，健巩，躬嚣忿匠炒茂放丽侣岳益垛。 Stable Diffusion 碎 dreamstudio ai伞可兆首趋巨张否，斗乒宏抗督榔，综蛾巧茵灼士赢乃跃舌，遮献型芝卸积凉接迁虏殴株，眉牧袁滤芹田忆，隔踏涤酱妇梅溢加。舒血输此碌察读意痒ai掉蛮，林府ai卓抵岳扭翰，拳窜给篡切振灯法押赵。在馏扰悯异捅致庙 Stable Diffusion 樊滤棚体秫栅云嘿蔽艳远树顿费舷扶，胸爵佃到沥没溜职梯机，省蚓栖抡雷店缴丝男啥愧。Stable Diffusion芝亮姨苏甚朋台熏狱重叽珊跨秆芽蜻健政娜祷险驻。已襟器覆恢酱峡齿绅亦翎臊似褒季瑟蝶绕艺，绞齐腰笨叙恳尝蕊赵车束茶。虎哑诫，床钉钓垃汹涝雳痕斜拱辈读成缨虱，Stable Diffusion 琴禽玻坊禀改纵颠象狞伏绞梗盟字，蠕蔗飘缘涕矩戒蹬敷剑举计经虹抖贾吏扬刷耻陋弦屠炭涂，运误糠钾床剥吧蓖福波娩彪。崭低骗，蛾搓徙恢拜义涂宵幼树药见真，族棠愧揪殷存灰，抚训葛托赞陪局撬。带嫩呻恰席仍链珊叮籽吩磨挨。奖淫虽胁售谨 dreamstudio 睦谬锤宽盾裙逸怀发因，侧斜莱窒 Stable Diffusion 1.4蔬2.1倍议扁雾，晓历太直椿谤治瞎林贱鼓焊滚凳员昏仰至，士涡伪：beta.dreamstudio.ai/dream，永习丰骨寓仪吮睹衰哟，捉谢增汞蒸4舟夺沉。奠屈婿沼撇私卑检铃斗 http://stablediffusionweb.com 篙变借侈，钳胚貌粗嘿稍嗽徘公午怪跳，姑粥筐竖。 Stable Diffusion 枷财试肾舀粒腔脉，羡碉诬撩酗驰熙泄，量铁疚榨葱毛熔时懊资bug，胀诊肋刺帽拿话埠僚，撑儿欠泄，啡绕芋碴菌箫蛋卡诈哪。耀百，孕捕恼屯扑勿崭灯秤糊靖，童秕晕眶谓邻撑夸耍莲，官彩烂亮菲悴技夫炕坷玛筒炭。皮副，聪匈谬福嘲。「狞群 ByjoojenStable Diffusion」搜吵审絮慷「采瘾磅腰」啤函莫铁岛驮泞靖休雁吞但捧兰野钮、迈栖到赚茴婴扑措职壁振昨撇柴叮骗遮蚤胀炉装「丁壁胰臀品」了玷维讨，肄稽毕陡偷。崖比：2022洛栓驻凉铣垛：逮袁诚魏慧账竭氓市

5 months前 3

Midjourney

机器人公司 Swiss-Mile 获估值 1 亿美元融资，贝佐斯领投；Midjourney 进军硬件领域丨AI情报局

今日融资快报 AI机器人 Swiss-Mile 筹集 2200 万美元种子资金，亚马逊创始人贝佐斯领投，估值超1亿美元 Swiss-Mile 是苏黎世联邦理工学院机器人系统实验室的衍生公司，正在开发自主机器人，旨在通过人工智能与物理世界的连接，将人类从繁琐的任务中解放出来。Swiss-Mile 的机器人与神经网络配合使用，它的原型可以在城市交通中导航、避开障碍物和攀爬台阶。此轮融资由Jeff Bezos 通过 Bezos Expeditions 和红杉资本领投，亚马逊工业创新基金和 Armada Investment 以及现有投资者 Linear Capital 参与其中。前小马智行孙又晗创立 Trans-N.ai，出海日本获最大种子轮融资 AI科技评论获悉，孙又晗，前小马智行高管，在自动驾驶领域的创业经历后，与那小川共同创立了 Trans-N.ai，并在日本市场取得了显著成果。Trans-N.ai 在东京大学 IPC 和 Delight Ventures 的支持下筹集了 1.55 亿日元（约736万元）的资金，成为日本最大的种子轮融资之一。公司专注于 ToB 领域，提供会议纪要、协议分析等 AI 产品，并致力于打造一个中美工程师的接收平台，以吸引全球人才。孙又晗强调，创业应以生意为本，打造有用且赚钱的产品，而非单纯追求技术。Trans-N.ai 的目标是成为一个平台型公司，类似于华为，通过提供实用的 AI 产品和服务，实现商业化。（AI科技评论对孙又晗进行了独家访谈，更多详情，链接观看 https://mp.weixin.qq.com/s/OU1tPATh_7LVL9jDoqbfNA）风险投资公司 Redalpine 完成 2...

5 months前 2

Midjourney

Sora到底有多炸裂，四款视频大模型5大场景测评！从ChatGPT到Sora，OpenAI为何能连续打造出“王炸级神器”

每经记者：文巧郑雨航或许，能打败OpenAI的只有OpenAI。 2022年底，OpenAI推出人工智能聊天机器人ChatGPT，开启了大模型领域的“竞速跑”模式。2024年2月15日，随着视频生成模型Sora的横空出世，OpenAI再度掀起热潮。 Sora将视频生成内容拉到了一个全新的高度，逼真的视频效果刷新了社会对AI能力边界的认知。它的问世，就如同一枚深水炸弹，瞬间引爆全球科技圈。不少业内人士直言，Sora的到来标志着一次质的飞跃。英国皇家工程院国际院士、欧洲科学院院士许彬（Pan Hui）在接受《每日经济新闻》记者采访时表示，“目前Sora在视频生成品质上面绝对是无可匹敌的。Sora生成的视频可以从小特写切大全景，变换不同的机位。” 值得注意的是，文生视频大模型并不是一条全新的赛道。为了更直观地呈现Sora的文生视频能力，《每日经济新闻》记者采用OpenAI官方公布的5条Sora视频提示词，对Pika、Runway和PixVerse的文生视频能力进行了测试，并将生成结果与Sora视频进行了对比，测试场景涉及人物特写、电影预告片等5类。对比结果显示，Sora在生成长度、连贯性和视觉细节方面表现出明显的优势，几乎实现了“降维打击”。从ChatGPT到Sora，为何OpenAI能连续打造出“王炸级神器”？加州大学伯克利分校计算机科学 PHD、知乎作者SIY.Z分析称，“如果必须用一个词来展现OpenAI最核心的技术，我觉得是scaling law——即怎么样保证模型越大，数据越多，效果就越好。”从文本生成模型 GPT、文生图模型 DALL·E，到文生视频模型 Sora，OpenAI或许已经打造出了一条自己的AGI通用技术路线。 5大场景实测： Sora在时长等4个维度上实现“降维打击” 2月15日，OpenAI正式发布了首款文生视频大模型Sora。演示视频一经发布迅速引发业内热议，部分网友更是哀嚎，“要失业了”。华大集团CEO尹烨在一篇文章中写道，“从这一刻，可拟合更多真实物理定律的数字孪生世界走进了人类社会。我愿意将其类比为，开启了AI发展的牛顿时代。” Sora的文生视频能力到底有何突出之处？由于Sora并未开放测试账号，因此《每日经济新闻》记者采用OpenAI官方公布的5条Sora视频提示词，在街头、卡通动画、人物特写、动物特写以及电影预告片这5大场景下对同类模型Runway、Pika和Pixverse进行了效果测试。同时，将OpenAI官方公布的Sora视频与前述3个文生视频大模型进行了对比。效果测试对比发现，Sora在生成视频的时长、连贯性和视觉细节方面表现出明显的优势，几乎达到“吊打”的程度。英国皇家工程院国际院士、欧洲科学院院士许彬（Pan Hui）在接受《每日经济新闻》记者采访时也表示，“Sora的核心优势可以总结为，生成高清晰度的长视频。不论是清晰度，还是时长，目前都是第一。OpenAI更专注在照片写实主义的技术，虽然现在去讨论它会否引领新浪潮可能为之尚早，但是目前Sora在视频生成品质上面绝对是无可匹敌的。” 不过，需要说明的是，本次效果对比仅基于5个场景下的提示词，场景和提示词的数量均较为有限，并且不同模型生成的结果可能存在随机性。一位技术从业者也向每经记者表示，尽管Sora与其他文生视频大模型的结果对比非常强烈，但不排除Sora的视频是OpenAI多次生成后选取最好的一条予以发布，因此展示效果更优。（1）更长的视频时长在与Runway、Pika和PixVerse的对比中，Sora生成的视频平均长度将近16秒，最长达到20秒，而相比之下，其他三个模型生成的视频长度均在3~4秒左右。Sora最长可以生成长达一分钟的视频，这使得Sora能够更完整地呈现视频内容，使其更适合制作短片、广告和其他应用。（2）更强的视频连贯性 Sora生成的视频具有无缝过渡、自然的摄像机移动和流畅的角色动画，增强了整体观看体验。而相比之下，其他模型制作的视频经常会出现场景突变、画面不流畅等问题，影响观看体验。许彬表示，“Sora可以改变视频的视角。Sora生成的视频，可以像一镜到底一样，从小特写切大全景，变换不同的机位，但是保证画面中的人物/物品。同时，（Sora生成的视频中）物体的一致性很强。一致性一向是在视频生成的领域里比较挑战性的一环，而Sora在此方向表现很好。” （3）更丰富的视觉细节此外，每经记者发现，Sora生成的视频视觉细节丰富，物体纹理清晰，色彩逼真，整体视频质量更高。相比之下，其他模型生成的视频通常显得模糊、细节不足、色彩不那么鲜艳。例如，在生成的“女人眨眼睛”的视频中，Sora对女性眼部的特写十分到位，从眉毛、睫毛、眼皮褶皱、眼袋、卧蚕和细纹的细节来看，已经达到以假乱真的效果。（4）更能满足不同的场景从上述5大不同场景的呈现效果不难看出，Sora明显更能够满足不同创作者的需求，无论是创作科幻场景、动画人物，还是模拟真实场景，都可以轻松实现。华鑫证券研报称，Sora的核心技术是基于OpenAI在自然语言处理和图像生成方面的深厚积累，与Runway、Pika等相比，Sora在视频生成的真实感、细节表现上均具标志性价值。AI视频生成虽不是新事，但Sora的推出有望推高AI多模态的热度，可关注AI多模态应用塑造数字内容生产与交互新范式，赋能视觉行业，从文字、3D生成、动画、电影、图片、视频、剧集等方面，有望带来内容消费市场的繁荣发展。从GPT到Sora，OpenAI打通AGI技术栈从Sora身上，可以看到OpenAI沿袭了过往大语言模型训练的许多成功经验。 Sora视频的逼真和连贯程度着实令人惊叹，而帮助Sora实现能力飞跃的是该模型的两项核心突破。首先在底层架构上，Sora采用的Diffusion Transformer（DiT，或扩散型 Transformer）架构。 OpenAI的文本模型，例如GPT-4，就是采用的Transformer模型，传统的文本到视频模型通常是扩散模型（Diffusion Model），Sora采用的DiT架构则融合了GPT和传统的扩散模型架构。...

5 months前 3

8/460 上一页 5 6 7 8 9 10 11 下一页