文生视

守得云开见月明?国产Sora接连推出,算力需求快速增长,海光信息涨超4%,信创ETF基金(562030)涨逾2%
Sora

守得云开见月明?国产Sora接连推出,算力需求快速增长,海光信息涨超4%,信创ETF基金(562030)涨逾2%

  今日(8月15日)A股三大指数集体反弹,沪指涨近1%,信创板块卷土重来,中证信创指数50只成份股47只收红,19只涨逾2%,其中,赢时胜、绿盟科技、海光信息领涨超4%,新点软件、安恒信息、福昕软件、东方国信、奇安信涨逾3%。   图:中证信创指数涨幅前10大成份股   热门ETF方面,重仓软件开发行业的信创ETF基金(562030)早盘快速上攻,场内价格盘中上探2.39%,收涨1.27%。   消息面上,字节跳动旗下剪映团队研发的一站式AI创作平台“即梦AI”移动版上架苹果AppStore应用商店,单个视频生成收费约0.5元。目前,包括即梦AI、快手可灵、PixVerseV2、智谱清影、Vidu在内的国产“Sora”陆续推出,主要通过订阅方式收费。   中信建投表示,国产“Sora”接连推出,多模态发展不断突破,AI作为新型生产力工具,算力确定性较高。   放眼全球,虽然英伟达B系列产品出现延后,但随着技术、产能等问题陆续解决,2025年BlackwellGPU有望放量,并且Hopper架构产品需求仍然较为旺盛。同时,北美CSP厂商资本开支持续增长,微软、Meta、亚马逊、Google等厂商资本开支指引提升,AI算力板块仍具高景气度。   天风证券认为,国产算力高景气度亦有望持续,具体来看:   1、智算中心2024上半年招投标数量同比暴增407%   2024上半年智算中心招投标相关事件791起,较去年同期增加407.1%。从类型来看,大体可以分为三种不同性质智算中心——运营商、政府、企业。上半年,运营商相关智算中心招标占总体招标数量的55.8%,政府类型智算中心招标数量占比33.9%。   2、地方政府有望接力运营商,成为智算建设主力军   从2023年底开始,北京、上海、安徽、重庆等多地密集发布算力相关政策,多以2025年为目标建设智算算力。由于新建智算中心需要1-2年建设周期,2025年或密集上架。预计地方政府2025年建设107.1EFlops,同比增长超300%,有望接力运营商成为2025年智算建设主力军。   国新证券表示,国内大模型持续迭代,对算力需求也将呈现指数级增长,算力国产化或是我国科技自立自强趋势下的主线,今年政府明确提出要开展“人工智能+”行动,打造具有国际竞争力的数字产业集群,适度超前建设数字基础设施,加快形成全国一体化算力体系,国资委也提出央企国企将进一步加快完善我国人工智能基础底座,新一批智能算力中心的建设也将提上日程,国产IDC、服务器、算力、算法等相关龙头企业有望受益。   “信创蓝海,指选龙头!”,展望全球局势,地缘政治因素扰动,逆全球化趋势加剧,自主可控需求迫切,从国家安全、信息安全、产业安全的角度来讲,信创领域,均有国家大力扶持和企业加速发展的必要性。公开资料显示,信创ETF基金(562030)被动跟踪中证信创指数,截至二季度末,按申万二级行业口径,软件开发行业占比超50%,汇聚信创龙头,指数具备高成长、大空间特性,可一键投资信创产业链核心环节。看好信创板块发展前景的投资者,或可重点关注。   数据、图片来源:Wind、沪深交易所、华宝基金等。   风险提示:信创ETF基金(562030)被动跟踪中证信创指数,该指数基日为2017.12.29,发布于2012.12.21,指数成份股构成根据该指数编制规则适时调整,其回测历史业绩不预示指数未来表现。本文中指数成份股仅作展示,个股描述不作为任何形式的投资建议,也不代表管理人旗下任何基金的持仓信息和交易动向。基金管理人评估的该基金风险等级为R3-中风险,适宜平衡型(C3)及以上的投资者,适当性匹配意见请以销售机构为准。任何在本文出现的信息(包括但不限于个股、评论、预测、图表、指标、理论、任何形式的表述等)均只作为参考,投资人须对任何自主决定的投资行为负责。另,本文中的任何观点、分析及预测不构成对阅读者任何形式的投资建议,亦不对因使用本文内容所引发的直接或间接损失负任何责任。基金投资有风险,基金的过往业绩并不代表其未来表现,基金管理人管理的其他基金的业绩并不构成基金业绩表现的保证,基金投资需谨慎。 MACD金叉信号形成,这些股涨势不错! 海量资讯、精准解读,尽在新浪财经APP 责任编辑:何俊熹
AI视频生成狂卷!4人小团队造出Sora竞品,耗费数千块GPU,已开放公测
Sora

AI视频生成狂卷!4人小团队造出Sora竞品,耗费数千块GPU,已开放公测

智东西 编译 |  徐豫 编辑 |  漠影 智东西8月22日消息,据VentureBeat 8月20日报道,AI初创公司Hotshot的同名文生视频模型“Hotshot”开放公测,用户可以访问Hotshot.co官网使用该模型,现阶段每人每天有两次免费创作机会。 Hotshot模型由4人小团队用数千块GPU训练而成,可以生成10秒以内不同主题的视频,耗时短、清晰度高、操作界面简洁。与主流的AI文生视频模型相比,Hotshot公测版兼顾视频生成效率和稳定性的同时,视频风格更丰富,生态也更加开放,可生成无水印视频。 ▲可用Hotshot生成风格多样的视频(图源:Hotshot) Hotshot成立于2023年,联合创始人为Aakash Sastry、John Mullan和Duncan Crawbuck。这三位公司创始人已有11年的消费级应用开发经验,并从Lachy Groom、Alexis Ohanian、SV Angel等人那里获得了资金支持。 体验地址:https://hotshot.co/ 一、最长10秒,清晰度720p,可定制动漫效果 Hotshot文生视频模型是一款Transformer扩散模型,其最新版本可根据文字描述生成一段最长10秒、清晰度为720p的视频。 例如,在Hotshot中输入“柯基坐在学校教室里”,我们可以得到,两只毛发分明顺滑的柯基,身穿不同花色、样式的衣服,坐在木色椅子上东张西望,柯基身后是写有粉笔字的黑板,而黑板旁有一个陈列地球仪等教具的展示柜,整体拍摄视角不断推进的一段视频。 ▲Hotshot根据文本“柯基坐在学校教室里”AI生成的视频(图源:Hotshot) 除了模拟真实的人物、场景、风景,用户还可以用Hotshot制作动漫、逐帧动画、特效等风格化视频。 Hotshot生成的一段视频中,一位金发年轻男子,身穿蓝色衬衫和深色裤子,坐在客厅的黄色沙发上,玩着手持电子游戏,客厅布置了绿植、挂画。视频画面配色鲜艳、笔触粗犷,呈现出50年代的复古漫画风格。 ▲Hotshot可以风格化处理视频(图源:Hotshot) 二、4个人耗时4个月,投入6亿段素材,花费几千块GPU 这样一个“类Sora”的文生视频模型,Hotshot仅靠团队4人,耗时4个月,便完成了该模型的训练工作。 据Hotshot介绍,最新版的文生视频模型在训练中投入了6亿段视频及音频素材、几千块GPU,高强度的模型训练常常导致NVIDIA H100 GPU出现故障,“机房差点着火”。为了让模型不偏离预期方向,团队成员一个月都没有休息,轮流监控训练结果。 3位创始人和新成员Chaitu Aluru还开发了一个新的自动编码器,在“空间”和“时间”上压缩视频内容,而非折损视频质量和相关数据,从而更高效地训练长序列视频。 三、过去一年多,Hotshot模型3次升级换代 Hotshot曾推出过AI文生图应用和两代AI文生视频模型,可惜未能激起较大的水花。 去年,Hotshot上线了同名消费级AI文生图应用,用户可以免费用Hotshot生成和修改照片,但该应用可能已被下架。 后续Hotshot推出了AI文生视频模型Hotshot-XL,并开源。该模型可以生成时长1秒,帧率8fps的视频。当时,Hotshot-XL的月活用户超2万人次。Hotshot Act-One则是Hotshot-XL的升级版,拓展了AI视频生成的时长上限。Hotshot Act-One模型可制作时长3秒,帧率同为8fps的视频。 Hotshot联合创始人Sastry在社交媒体X的帖子中写道,Hotshot是“目前最先进的公开模型”,十多年以来,我们首次能够为用户提供“强大且新颖的”AI文生视频功能,而这仅仅是一个开始。 结语:AI文生视频模型很卷,但还没有绝对的赢家 在Sastry看来,未来一年内,YouTube将被多模态生成式AI作品“刷屏”,AI文生图、文生视频、文生音频、图生视频等创作方式,将成为数字媒体上的常态。 市面上AI视频生成模型和应用的竞争也愈发激烈。AI视频创企Runway ML的Gen-3 Alpha Turbo、AI大模型独角兽OpenAI尚未公开的Sora、3D建模与视觉AI公司Luma的Dream...
实测七款“国产Sora”,恕我直言……
Sora

实测七款“国产Sora”,恕我直言……

文 | 硅基研究室,作者 | kiki 8月的一个普通夜晚,即便是在凌晨,快手可灵的官方创作者交流群里,讨论声依旧不减。 “美女、萌宠和科幻”。一位创作者这样分享自己的AI视频流量密码。“求大神的提示词,来一个”“怎么赚钱?求带?”类似的声音不在少数。 这一发生在可灵社群里的讨论,恰好反映了时下AI最热门赛道的现状——AI视频的火热。 自今年6月起,国内AI视频的迭代速度似乎进入了一个「大爆炸期」。6月,快手可灵、Runway、Luma AI等产品全面对外开放;7月,商汤推出最新AI视频模型 Vimi,爱诗科技发布PixVerse V2,生数科技Vidu大模型开放使用,智谱AI在官宣AI生成视频模型清影(Ying)正式上线的同时,还顺便开源了自家的视频生成模型CogVideoX-2B…… 在国内竞逐AI视频的玩家中,也鲜明地分为两派:第一类是大厂派,典型是快手与字节跳动;第二类是AI大模型创企,如智谱AI、爱诗科技、生数科技、MewXAI(艺映AI)、右脑科技(Vega AI)等,据「硅基研究室」不完全统计,目前国内涉足AI视频领域的选手有近20家,行业整体呈现加速迭代的趋势。 据东吴证券的测算,中国AI视频生成的行业潜在空间为947~5858亿元,在中性假设下(AI渗透率=15%)为3178亿元,其中C端、B端市场空间分别为 2673亿元、505亿元。 不过,行业热闹与前景的B面,AI视频还没到「开香槟」的时刻。我们实测国内7款的AI视频产品后发现——能用的很多,但好用的很少,在玩家们激进的商业化策略中,还远没从「玩具」进化到「生产力工具」。 「国产Sora」实测:能用的很多,但好用的很少 层出不穷的大片demo,来自各界的赞美,让国产AI视频成为了时下最热闹的赛道,在Sora尚未开放时,国内的AI玩家似乎都在抢抓这一窗口期,把「对标Sora」写在了日程表上。 最激进、最为耀眼的当然要数快手的可灵,猎豹移动董事长傅盛甚至在体验过后表示:“我觉得(可灵)也吊打了Sora,我认为这个产品今天,在我能使用的范畴内就是全世界第一的。” 事实果真如此吗?热闹和喧嚣之外,国产AI视频产品真的已经如此能打了吗?为了探究这些问题的答案,「硅基研究室」选取了国内较为热门的7款AI视频产品进行实际体验,我们的发现是:能用的很多,但好用的依旧很少。 我们选取的7款产品分别为:快手的「可灵」、字节跳动的「即梦」、智谱AI的「清影」、爱诗科技的PixVerse V2、生数科技的Vidu、右脑科技的Vega AI以及MewXAI的艺映AI。 在实测标准上,我们将比较不同产品的三大能力,包括基础能力、理解能力和生成能力,为了尽量保持客观,大多数AI视频镜头都需要多次抽卡,因此我们将使用统一的提示词,展示一次性生成的结果,同时因为篇幅所致,文章仅展示部分视频生成结果。 • 基础能力:产品主要的基础功能比较 • 理解能力:主要考察产品对简单和复杂提示词的理解。 • 生成能力:包括视频生成速度和视频画面的稳定性、一致性、准确性与创造性。 以下为具体的实测结果图—— 场景一:简单提示词+静物定格画面 在该场景下,我们选取了Sora发布时的一段提示词:A stop motion animation of a flower growing out of the windowsill of...
Open-Sora 开源版Sora复现方案
Sora

Open-Sora 开源版Sora复现方案

🎥 前言 在人工智能盛起的当下,AI正以非常迅猛的速度重塑着很多行业。可以预见的是2024将是AI原生应用开发元年,将会涌现出数不清的AI原生应用来重塑我们的工作和生活的方方面面。而在AI原生应用里面将会以AI Agent即AI智能体为主要代表,将会有很多个像crewAI—用于编排角色扮演的AI agent(超级智能体)一样的Agent出现在我们的面前。在可以预见的未来,世界大模型Sora—聊聊火出圈的世界AI大模型——Sora毫无疑问将会带来革命性的AI热潮。 今天要介绍的是一款复现Sora技术的开源项目。 📎 目录 •🎥 Open-Sora     •📎 目录     •📍 概览     •📂 数据集准备          •使用 MSR-VTT          •使用自定义数据集      •🚀 开始使用          •训练          •推理 最新消息 [2024/03] Open-Sora:Sora...
MidjourneyAPI使用教程:如何接入及实战演示
Midjourney

MidjourneyAPI使用教程:如何接入及实战演示

这篇文章介绍了如何使用Midjourney API,首先要通过触站AI来调用Midjourney的API接口。在触站AI界面中,找到“API调用”按钮,进入API调用页面,选择Midjourney的API接口并填写申请信息,提交申请后等待审核,审核通过后获取API密钥,然后按照开发文档将API密钥嵌入到站点代码中,最后根据需求开发前端和后端系统,充分发挥Midjourney的功能。
《AI绘画大师清风徐来的秘密武器:DALL-E3全面解析》
DALL-E

《AI绘画大师清风徐来的秘密武器:DALL-E3全面解析》

这篇文章介绍了DALL-E 3,这是一个人工智能绘画工具,能通过输入文字提示来生成图像。DALL-E 3已经向所有ChatGPT Plus和Enterprise用户开放,可以通过对话来创建独特的图像。文章还比较了主要的AI绘画软件,包括Midjourney、Adobe Firefly 2和Stable Diffusion,并给出了本地部署秋叶安装包及教程。此外,文章还分享了使用DALL-E 3的一些技巧和注意事项。
Stable Diffusion|轻松去除和增加图片中的物体
StableDiffusion

Stable Diffusion|轻松去除和增加图片中的物体

今天分享一个用Stable Diffusion将图片中不需要的物体去掉,然后将需要的内容添加到图片上的小教程。现在不管是在朋友圈还是在自媒体平台上,我们经常能够看到这样一句话“谁能帮我把什么什么P掉”,目前现在大家常用的方法就是用PS或其他的图片处理工具将图片中不需要的物体去掉,但这方法需要耗费大量时间,且效果可能不尽如人意。 用Stable Diffusion来处理这样的事会简单很多,它可以在图片中精确地去除不需要的物体也可以很自然的添加我们想要添加的物体,同时保持图像的真实和自然。 1 前期准备 1. 本文需要用到ControlNet插件,如未安装的需要去安装一下,然后下载相关的模型。(安装方法就不一一介绍啦,如果有任何疑问或问题可以在公众号后台私聊我) 2. Inpaint Anything,用于给图片添加需要的物体,如未安装的需要去安装一下。 安装方法就不介绍啦,如果需要看安装方法,可以看前面发布的一篇文章: Stable Diffusion|Ai赋能电商 Inpaint Anything 3. 准备一张需要处理的图片。 2 去除物体 1. 打开Stable Diffusion,“启用”ControlNet并且勾选“完美像素模式”,然后上传图片。 2. 在控制类型中选择“局部重绘”,预处理器选择“inpaint_global_harmoniou”,然后模型选择“control_v11p_sd15_inpaint”。 3. 可以适当地增加控制权重的值,也可以根据输出的结果来决定是否需要进行调整。在控制模式方面,可以选择“更偏向提示词”选项,这样能够更好地控制输出的结果。 4. 在上方图片中,涂抹需要去除的物体。 5. 设置好ControlNet之后,选择一个跟图片相关的大模型,写实图片就选择写实大模型,卡通图片就选卡通模型。提示词这里可以描述一下图片的内容(不要写需要去除物体的提示词)。 如果不知道怎么写提示词,可以点击图生图,然后上传一下那张图片,点击“CLIP反推”反推一下提示词,然后将需要去除物体的提示词去掉即可。 6. 设置生成参数,尺寸建议跟上传的图片保持统一比例,其他的可以根据自己的需求调整。 7. 以上参数设置完成之后,点击“生成”即可。 我们可以看到图片中的人物很好的去除掉了,且整体画面看起来非常自然。 3 写实照片 接下来我们试一下写实照片。 1. ControlNet设置保持一样即可,只需要将图片替换一下,然后将需要去掉的内容涂抹一下即可。 2. 模型换成写实模型即可,然后提示词跟刚刚一样,不会写的可以在图生图反推一下,然后将需要去除的提示词去掉即可。 3. 设置生成参数,尺寸建议跟上传的图片保持统一比例,其他的可以根据自己的需求调整。...