文章主题:斯坦福洗碗机器人, AI, UMI, SDXL-Lightning

666AI工具大全,助力做AI时代先行者!

在AI领域持续引发关注的斯坦福洗碗机器人,近期再次成为焦点。这款原本用于实验室的AI神器,如今已经成功吸引了大量普通用户的关注。随着人工智能技术的不断发展,越来越多的创新应用开始涌现,为人们的生活带来诸多便利。而DALL·E这款由字节跳动推出的AI创作工具,也凭借其出色的表现,成功登上了开源榜单的前三。斯坦福洗碗机器人的 sudden surge in popularity has sparked a new wave of interest in the AI community. This innovative device, originally designed for use in laboratories, has now captured the attention of mainstream users. As AI technology continues to advance, more and more groundbreaking applications are emerging, revolutionizing various aspects of our lives.Amidst this excitement, DALL·E, an AI creation tool developed by ByteDance, has made a significant impact on the open-source scene. With its exceptional capabilities, DALL·E is quickly becoming a go-to solution for creative professionals and enthusiasts alike. As AI continues to reshape industries and transform the way we live and work, it’s clear that this technology will play an increasingly important role in shaping the future.

f22369eab0c54c868f203e7c137b7b2b.jpeg

图片来源:unsplash

近期,生成式人工智能(AIGC)领域又涌现出多款创意十足的新应用。

今天,钛媒体AGI对免费AI“神器”系列进行了第五轮的梳理,总共包含五款产品。这些产品的出现,无疑为我们对AI技术的应用范围提供了更广阔的想象空间,让我们看到了AI技术的无限可能。

斯坦福 AI 机器人框架技术——UMI
字节版DALL·E文生图模型——SDXL-Lightning
在线试衣服神器——OOTDiffusion
高质量动画生成模型——AnimateLCM-SVD-xt
“全能”视频生成大模型——VideoPoet
1、斯坦福 AI “螃蟹”洗碗机器人技术——UMI

继斯坦福炒虾机器人爆火全网之后,斯坦福大学再出新的“洗碗机器人”,引发关注。

产品信息:UMI 是由美国斯坦福大学团队开发的一个 AI 机器人数据收集和策略学习框架,通过手持式夹持器和精心设计的接口进行数据收集,可以将人类在复杂环境下的操作技能直接转移给机器人,无需人类编写详细的编程指令。

UMI是一种将人类操作演示转化为机器人学习的技术,其核心在于通过模拟人类操作来收集数据,并迅速将其应用到机器人身上,从而使机器人能够高效地掌握新技能。

产品功能:UMI 技术涵盖技能转移、数据收集、多平台部署、提高机器人操作能力、快速适应新任务、降低机器人学习成本等新亮点和功能,提供了一个便携、直观、低成本的数据收集和策略学习框架,允许直接让人类演示转化为有效的视觉运动策略。

1708698465885.jpg

1708698467113.jpg

与传统的机械臂遥控操作相比,UMI 在动态环境、精确度、双手操作以及长期视角等方面的表现,能够更迅速地实现人工智能机器人替代人类完成特定任务的效果。

项目及演示:https://umi-gripper.github.io

GitHub是一个非常重要的平台,它提供了丰富的资源,使得开发者可以更方便地进行协作和研究。其中,https://github.com/real-stanford/universal_manipulation_interface 项目是GitHub上的一个重要组成部分。

2、字节版DALL·E——SDXL-Lightning开源文生图模型

产品信息:SDXL-Lightning是一款由字节跳动开发的开源免费的文生图模型,能根据文本快速生成相应的高分辨率图像。

产品功能:用户在SDXL-Lightning上输入提示词,然后选择推理步骤(选择范围为1步—8步),等待数秒即可生成一张高清图像。

与先前的文生图模型相比,SDXL-Lightning在生成速度上有了显著的提升。它能在最少的操作中完成从文本到1024px分辨率图像的转换,这使得它在需要迅速反馈的应用场景中具有很大的优势。

1708698468755.jpg

SDXL-Lightning的生成效果图

SDXL-Lightning的生成速度之所以能够显著提升,主要是因为它通过结合渐进式蒸馏和对抗式蒸馏的方法,解决了扩散模型在生成过程中存在的速度慢和计算成本高的问题,同时保持生成图像的高质量和多样性,避免了传统蒸馏方法中存在的图像模糊问题。

使用SDXL-Lightning模型,可在几秒钟之内生成高达1024像素分辨率的图像。目前,该模型已经在Hugging Face平台上开源,并且下载量超过2200次,登上了Hugging Face流行趋势第三名,超越了gemma-2b,仅次于最新的谷歌gemma-7b,以及stabilityai/stable-cascade。

体验地址:https://huggingface.co/spaces/AP123/SDXL-Lightning

3、在线试衣服神器——OOTDiffusion

产品信息:OOTDiffusion是一个高度可控的虚拟服装试穿开源工具,可在线生成不同型号、款式的服装在模特身上的试穿效果。

产品功能:OOTDiffusion支持半身和全身虚拟试穿,用户在主页面选择与自身相似的模特体型,再选好心仪的服装款式,点击“Run”按钮后等待一分钟左右即可生成试穿效果。

03772347c18349ff9dd1febb64c57025.jpeg

OOTDiffusion主页面在右侧展示了模特的试穿效果。

用户可通过OOTDiffusion调整模型路径、缩放比例和采样次数等参数,精细控制虚拟试穿的细节和效果,以满足不同的试穿需求和偏好。

如未来推广开来,OOTDiffusion想必会成为网购爱好者的心头好。另外,线上服装品牌也可借其生成不同款式衣服的模特宣传图,节省一笔宣传经费。截至发稿,OOTDiffusion在Github上已累积988颗星。

体验地址:https://ootd.ibot.cn/

4、高质量动画生成模型——AnimateLCM-SVD-xt

产品信息:AnimateLCM-SVD-xt是一款能以尽可能少的步骤加速采样生成高保真视频的模型。该模型由来自香港中文大学MMLab、Avolution AI、上海人工智能实验室、商汤研究院的研究人员共同研发。

产品功能:在AnimateLCM-SVD-xt上,用户可输入提示词,并可自由选择推理步骤数、生成视频的宽高尺寸来定制生成视频。AnimateLCM-SVD-xt目前仅需2~8个推理步骤就能生成25帧分辨率576×1024的高质量动画,比传统Stable Video Diffusion(SVD)模型生成速度更快、视频生成质量更高。

1708698469862.jpg

VideoPoet生成的视频效果

体验地址:https://huggingface.co/spaces/wangfuyun/AnimateLCM

5、“全能”视频生成大模型——VideoPoet

产品信息:VideoPoet是谷歌推出的一款视频生成大模型,主要有文本转视频、图片转视频、视频风格转换、视频修复和视频生成音频五大功能,而且默认生成竖屏方向的视频,迎合了短视频内容的需求。

产品功能:VideoPoet在单一的大型语言模型中集成了多种视频生成能力,能根据不同的任务需求(如文本到视频、图像到视频等)调整其生成过程。每种任务类型都有特定的任务标记指示,以引导模型进行相应的视频生成。

此外,VideoPoet还能通过连续预测的方式生成长视频,即通过在每一步中参考视频的最后一部分(例如最后1秒),然后预测接下来的内容,从而实现视频的延伸生成。谷歌研发团队曾使用VideoPoet制作了一个浣熊去旅行的短视频。

1708698470838.jpg

谷歌研发团队曾使用VideoPoet制作了一个浣熊去旅行的短视频。

VideoPoet曾被外界视为革命性的Zero-shot视频生成工具。值得注意的是,2月22日有消息称,谷歌VideoPoet原项目负责人、卡内基梅隆大学(CMU)计算机学院兼职教授蒋路目前已经加入TikTok。

演示地址:https://sites.research.google/videopoet/

(本文首发钛媒体App,作者|任颖文,编辑|林志佳)返回搜狐,查看更多

责任编辑:

aigc666aigc999_0.jpg

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!

Leave a Reply

Your email address will not be published. Required fields are marked *