文章主题:文章关键词:ChatGPT,AI大模型,产业机会,技术突破。

666AI工具大全,助力做AI时代先行者!

图片来源 @视觉中国

文 | 略大参考,作者 | 尹凯,编辑 | 原野

ChatGPT 会成为 AI 大模型的 “iPhone 时刻 ” 吗?

在全球 AI 行业取得重大突破的这款大模型上线一周年之际,答案已经愈发清晰。历经多次进化的 GPT 大模型在全球范围内掀起波澜,人工智能领域的通用智能(AGI)逐渐显现出引领第四次工业革命的潜力,这无疑印证了 OpenAI 首席科学家伊利亚的观点:这是一个关键时刻,犹如倾盆大雨前的雨滴,的分水岭时刻。

更深入更细微的变化还在继续。

在未来的两到三年,我们将会看到一场翻天覆地的变革。这是由百川智能的创始人兼CEO王小川在12月1日腾讯ConTech大会上提出的观点。在这次会议上,他与长江商学院的教授孙天澍以及复旦大学计算机学院的教授邱锡鹏,共同探讨了人工智能在未来二十年里将如何影响和重塑各行各业,特别是互联网巨头和初创公司在这过程中的角色和定位。

01 变化

在仅仅一年的时间里,ChatGPT就实现了从仅能处理文本信息到同时处理文本、语音和图像信息的重大突破。这一惊人的进步速度引来了科技界的关注,甚至包括马斯克等业界大佬也纷纷联名呼吁,希望ChatGPT的进化速度能够慢一些。

大模型热潮正在不可阻挡地发展。OpenAI 已从一个最初 non-profit 机构转变为一个估值高达 900 亿美元的超级独角兽。如今,全球各大科技公司纷纷推出了自家的顶级语言模型,包括谷歌、Meta、我国腾讯、阿里巴巴、百度以及华为等。

在2023年腾讯ConTech大会上,三位嘉宾重点讨论了关于大模型产业机遇、技术创新以及未来发展趋势。

比如,大模型浪潮究竟是互联网大厂的机会,还是新一代创业公司的机会?

王小川的回答中并未出现 “二选一”的情况。他持有这样的观点:在大模型行业中,小创新依赖于大厂,而大创新则源自于小厂。这其中的原因在于,大厂本身拥有庞大的模型资源,只需稍作拓展,便可获得显著的经济效益。与此同时,相较于大厂,创业公司的生存率更低,这也意味着它们更有可能实现突破性的创新。

问题的本质在于,大模型的推动将引领时代的巨变,人类将跨越信息时代,步入智能时代。在这一过程中,无数新的公司将在市场上诞生,发展空间无比广阔。

在消费互联网C端的应用场景中,王小川对大模型的潜力表现出了较高的期待。他认为,大模型在智能助手和娱乐游戏领域有着广阔的发展空间。例如,它可以成为人类的私人教师、医生和律师,提供全方位的服务;同时,在娱乐游戏方面,大模型可以构建更为先进的”太虚幻境”,为玩家带来全新的体验。这得益于大模型采用底层语言引擎,能够生成世界观、真实世界中的物理逻辑以及社会文化逻辑等。

在技术层面,不管是 OpenAI 正在筹备的 GPT 商店,还是 Facebook 或者百川这类技术公司陆续推出的开源模型,开放,都在成为更加明朗的趋势。

由此可能带来的改变是大模型的平民化。邱锡鹏提到技术栈方面的体现,即,围绕某个大模型形成比较大的生态圈,提供好的个性化、定制化服务。不过,这需要解决计算成本的问题——这也是大模型变成人类助手的巨大阻碍。

因此,在他看来,进一步压缩大模型,甚至创造出新的架构,降低计算成本,让所有人都能用得起。大模型 ” 平民化 ” 的过程,也蕴含着大量机会。

不过,很显然,不是所有人和公司都能在合适的时机、抓住对的机会。

根据王小川的观察,大模型目前处于泡沫期,一些拥有技术力量的公司倾向于训练自己的大模型,因此导致了百模大战、千模大战。数据显示,到 2023 年 7 月时,国内大模型数量达到 130 个,已经超过美国的 114 个。到年底,前者又更新到了 238 个。

但本质上,这是一种焦虑:个人怕失业,企业怕掉队。在王小川看来,现在很多算力是浪费的。当行业进入成熟期,少量企业会拥有自己的数据与场景,甚至训练出自己的模型去赋能行业,但多数企业通过调用就足够了。

在现阶段,他的建议是:克制欲望,不要着急训练自己的模型,而是先把市面上已有的模型用好,通过产品和市场,先验证自己的判断,把第一步走好。

不过,区别于 AI 技术在过去几十年里的任何一次爆发,人类对于 AGI 的态度更加热烈,也更加谨慎。根据 OpenAI 首席科学家伊利亚的说法,这是因为 AGI 区别于人类迄今为止创造的所有东西,它具有自己的目标,完全自主。

AGI 自身,以及人类围绕 AI 技术的研究的飞速迭代,决定了 AI 行业的这场狂飙,也决定了,身处其中之人,必须时刻进行自我迭代。

王小川在 ConTech 大会中谈到了自己的观念变化。

他原本有个观点:理想上慢半步,落地上快一步。相比技术科研,中国的优势可能在应用层面。但今年 6 月去美国与大模型同行们交流后,他改变了,想要:理想上慢一步,落地上快三步。

一方面,拥有 7 年积累的 OpenAI 在技术层面已经领先太多。比如 OpenAI 现在正在进行的研究是,尝试把 1000 万颗 GPU 连在一起训练一个大规模的模型,而国内现在还在 4000 颗 GPU 对标 GPT-3.5 的阶段。不过,在应用层面,中国互联网的产品体验远强于美国,移动互联网时代也培养了大量优秀的产品经理,这些都是优势。

一句话就是:更加彻底地扬长避短。

02 狂飙

王小川的观点,或许也是多数大模型创业者的心态缩影:在月亮与六便士之间,优先选择后者。

毕竟,先活下来,才有机会参与到后面的故事。

苹果公司在移动互联网时代建立起来的供应链与生态王国,成为很多还在路上的大模型中国创业者的 ” 灯塔 “。仅仅在 A 股,苹果产业链上市公司就有 118 家,” 苹果吃肉,供应商喝汤 ” 的说法广为人知。更不用说,那些通过做一款 APP 而改变人生轨迹的海量创业者们。

目前来看,Open AI 很可能成为新时代里的苹果公司——就连创始人被驱逐出董事会再回归的桥段,都如此相似。就算它无法复制苹果的成功,微软和谷歌也足够有野心。

在中国创业圈,AI 狂飙的剧情正在上演。

今年以来,多家大模型初创公司拿到融资,企名片数据显示,今年中国 AI 领域融资 214 亿元,百川智能、Minimax 和智谱 AI 三家公司在资本市场尤为受欢迎,融资额占比超过 30%,基本形成第一梯队。

图:人工智能领域该周内融资 6 起,融资金额 21.73 亿元。其中,在 10 月 17 日,百川智能完成 3 亿美元的 A1 轮战略融资。

以成立于今年 3 月的百川智能为例,它在天使轮拿到 5000 万美元,AI 轮拿到 3 亿美元,参与方包括阿里、腾讯、小米和多家头部投资机构。

陆奇创办的奇绩论坛,成为这波 AI 浪潮的缩影。根据《中国企业家》报道,在今年的秋季路演日上,67 家创业公司参与,其中 51 家为人工智能领域。更早些时候的春季路演日,人工智能和大模型相关创业项目为 82 个,超过总项目的一半。

更多明星人物在 AI 大潮中变得炙手可热。比如创立光年之外的王慧文、创立百川智能的王小川。他们此前在互联网和移动互联网时代的履历已经足够光鲜,唯一的缺憾就是,尚未独自站在舞台中央。

如今,AI 让一切成为可能。

王慧文曾经在接受采访时提到美国投资人埃拉德 . 吉尔的观点:在部分科技浪潮中,所有的价值都可以由初创企业捕获,而在另外的浪潮中,大部分价值会归成熟企业所有,或者会在初创企业和成熟企业之间分配。在王慧文看来,AGI 浪潮属于后者。因为大模型的技术跟过去差异极大,市场具有不可预测性,创业公司就有了发展空间。

不过,类似这样的观点,还有待时间去验证。

创业者纷涌入局,实力更雄厚的大公司们,自然也不会缺席。

场景、数据、模型和算力,共同构成了大模型的四要素,这也意味着门槛——创业公司或许能擅长其中的一项或者几项,但想把它们尽可能多地集齐,显然还是大公司更有优势。根本上,这是关于科技的硬较量,需要大量资金与高端人才的投入。

整体来看,大模型在国内经历了三个阶段:今年 3 月起,百度、阿里、华为、腾讯、360 等大厂陆续发布大模型;5 月起,包括商汤在内的 AI 1.0 公司,以及知乎等中小互联网公司跟进;10 月起,一批大模型进行迭代,部分国产大模型宣布开源。

至少到现在,大厂与创业公司们还没有形成泾渭分明的敌对阵营。狩猎、绞杀和反抗的戏码,还没有拿到出场的指令。更多时候,以及接下来的很长时间里,他们都需要彼此借力,争取在国内形成健康繁荣、且能持续相当时间的 AI 生态。

不过,人们在现实中感受到大模型赛道狂飙的影响,或许不需要等待太久。

在 2023 腾讯 ConTech 大会中,王小川给出的答案是 ” 未来两三年 “。他借用了孙正义的观点,” 会用 AI 和不会用 AI 的人就像人和猴子的区别一样 “,他相信,人们的工作和生活方式很快会因为 AI 而发生巨变。

变化带来机遇,也带来希望。

财经作家吴晓波在《激荡三十年》中写道:” 这是最好的时代,这是最坏的时代。这是史诗,幸而你我活在其中,幸而未完。” 对于 AI 时代,史诗的序曲或许刚刚奏起。

以下是 2023 腾讯 ConTech 大会相关访谈实录:

孙天澍:我们讨论的第一个议题是大模型的产业机会,AI 正在以什么样的方式重塑产业,里面的机会在哪?接下来大模型在消费互联网 C 端的产品形态和商业机会有哪些?到底是互联网大厂的机会,还是新一代创业公司的机会?

王小川:大模型来了以后,无论是大厂还是创业公司、投资人都已经很疯狂开始发展这样的技术。我的看法是,大厂至少在现有的产品迭代升级里面有挺多空间,人员密集型的地方可以用大模型来做替代,也能够升级自己的产品。但是对创业公司而言,死亡率会更高。

行业之前做大模型,有一个概念叫做大创新靠小厂、小创新靠大厂。大厂的体量也会有大模型,只要增加 1% 就是巨大的受益。但是最大的创新可能来自于创业公司。新的一波机会,我们的看法是从信息时代走向智能时代,会有新的公司起来。

至于 C 端怎么用?大模型不是一个工具,它掌握了语言、世界知识等,起到了陪伴人类的伙伴角色。它也能成为各种各样的助手,比如写作助手、问答助手、私人老师、私人医生、私人律师等。

娱乐行业对于大模型同样有着巨大的需求。人类除了工作创造,也需要休闲,大模型在情感陪伴领域不仅可以拟人,甚至可以拟出一个虚拟世界。这将会给娱乐行业、游戏行业带来很大的变化。因此,大模型在 C 端里的两个重大方向分别是娱乐行业和助手。

孙天澍:小厂做大创新,大厂做小创新,但是大厂有自己的阵地,可以在已有的电商娱乐等方向、APP 上进行升级。小厂可能会探索出一些全新的产品,全新的结构,这里面有非常多有意思的新一代的产业机会。想问一下邱老师,大模型在开放态度中的产业机会。整个大模型在开放生态发展非常迅速。第一,未来开源模型在海外,在中国会不会收敛到一到两个模型?第二,为开放生态进一步发展,大模型公司还需要做哪些准备?国内大模型公司需要在能力上做什么准备,能够达到像 OpenAI 和 Agent 智能体未来开放生态布局?

邱锡鹏:大模型生态变得非常开放,这里有非常多的参与者,涉及到平民化的问题。平民化可能分成两个:一方面,因为大家都在围绕着某个开源,围绕着比较大的生态圈,如果提供非常好的个性化、定制化能力的话,就是技术战,因为参与者众多,确实会降低很多研发成本。

现在,非常蓬勃的互联网生态发展包括 GPT 个性化、各种工具的使用、任务规划等,这些都需要比较大的模型。但由于大模型的算力成本和计算成本很高,存在一定阻碍。

目前来讲,由于成本的原因,国内还不能将大模型广泛地应用到每个人身上,让它变成每个人的助手。未来,如何去一步提升大模型的效率,把大模型进一步压缩,来降低它真正的计算成本,让每个人都能用得起,这才能达到真正的平民化。

孙天澍:请小川来分享一下,从大模型在企业服务未来的判断,对于企业家来说,想使用大模型能力,是应该思考用公有云上调、智能体结构,还是用自己的开源模型融合到企业知识库等,做更加私有化的部署?

王小川:开闭源场景里特别突出的矛盾问题是心态问题,大模型来了之后,全球人民都怕失业、企业怕自己掉队。这种情况下,有技术力量的公司,通常愿意训练一个模型出来,但这件事情并不够客观理性。现在正处于泡沫期,很多公司会愿意投资训练自己的模型。所以使得百模大战、千模大战,其实都是大家的焦感带来的。

事实上,到成熟期的时候,少量企业能够有自己的数据、场景,能训练出自己的模型给行业赋能,但是更多的企业通过调用方法就够了,挤掉泡沫后,才能沉淀出来大家的共识或者价值。

我给出的建议是,很多企业不妨克制一下欲望:不是先训练一个模型,而是先用起来,通过微软云、接口调用国内模型,将模型和业务链路融合起来。之后从产品、市场等方面验证可行性。

孙天澍:接下来问一下邱老师,您从研究者的视角,觉得整个大模型产业发展中,高校和研究者主要的角色和贡献在哪些方面?他们与大厂,与创业公司有什么不同?

邱锡鹏:我个人会更关注基础研究,现在大模型非常成功,它的推进速度比我们想象的更快,我和很多公司接触,发现他们底层已经都用大模型了,用大模型确实可以降低研发成本、标注数据等,它的广泛性确实非常好,可能比我们想象中还要更快。

但是做大模型和应用大模型,还是可以分开而谈。大模型还存在一些不足,包括如何做更高效果的架构、推理加速,训练加速等。如果面向未来智能体的发展,大模型仍然有很多模块欠缺,比如记忆能力、推理能力、规划能力等,包括现在大模型背后的一些机理,都不足以支撑未来更进一步推动智能化的发展。

作为学术界的人,我们更关注大模型的安全可信、诚实性等,争取让它更好地符合人类的价值观。

孙天澍:大模型时代来临后,人工智能要求人才的结构都很不一样,高校里有哪些培养机制?

邱锡鹏:以我们的经验来说,大模型需要全栈式的人才。应该是从底层的系统结构到模型如何训练,再到 AI 算法,甚至包括数据如何清洗都要懂。否则的话,中间会断,大模型研究上会比较低效。

孙天澍:中国大模型未来整个技术突破和核心竞争力会在哪些方面?在产品应用领域,中国的公司基于自己上一代的互联网经验,产品经验,以及基于中国大的消费市场,能不能做到全球领先?

王小川:我 6 月份去了一趟美国,跟 OpenAI 和其他做大模型的同行做了很多交流,发现我们要接受一个现实。OpenAI 已经发展了 7 年,在这样的技术积累和场景布局里面,我们是有巨大的差距。

但是我们的产品体验是远远优于美国的,这里包括大家对于运营导向、贴近市场的方式等。我们要在这方面培养大量的产品经理,在这种情况下,我们有巨大的经验和优势。这里有两个难点需要解决,第一,要有模型,我们要将模型公司与应用公司结合,甚至用开来源和端到端的模式解决,争取用较弱的模型做出好的应用。

第二,产品经理也面临转型和提升。对产品经理而言,他们懂得什么样的产品适用于今天的技术,甚至还能引领技术的发展。产品经理要对技术有判断和评价,争取让算法工程师跟上这个步伐,解决这两个问题,中国的应用就能走在美国的前面。

孙天澍:想问一下邱老师,从基础研究的角度来看,第一,AI 大模型的基础研究,怎么往更有效率的方式走?第二,计算机的研究、人工智能的研究,大模型对于整个自然科学领域的研究等,大模型可能会在哪些维度为技术突破、技术研究带来冲击和变化?

邱锡鹏:我们与 OpenAI 算力的差距太大,保持紧密的跟随。一方面能够锻炼我们的技术,另一方面保持不掉队,培养人才,能够达到非常好的效果。但是在赶超方面,还是要结合当前我国具体的实际情况,比如靠产业的带动,从中产生的需求,再把它转化到技术研究上。我们技术研究的问题,要由真实的需求凝练出来,所以产研合作在下一步变得非常重要。

现在的大模型或者以大语言模型为中心的新一代通用 AI 技术,是用语言来打底,构造一个非常完整的系列知识体系。很容易把人的各种经验通过语言作为载体附加到模型中,在做科学研究应用上的话,它的模式和形态可能跟以前不一样。它会更加侧重科研发现,类似于科研探索,或者主动让他得到一些新的结论。

孙天澍:关于技术突破还有两个很重要的话题,大模型四个要素场景、数据、模型、算力,想问大家对于中文语料进一步采集、整理和使用有没有什么建议?这个可以从你们自身企业发展的角度,或者模型发展角度,也可以从公共政策、产业政策的角度,谈一谈中文语料怎么样能进一步去采集优化?

王小川:主要分两部分,第一是训练大模型所需要的公有数据。第二是企业为了自己的竞争力需要的私有数据。我的逻辑就是不要迷恋于纯中文语料,需要高质量的语料都兼顾。至于企业自身数据,更多解决的问题是技术开放性怎么耦合到大模型里的问题。大模型核心靠的是预训练和最后的微调,企业语料怎么进去,需要技术实践,很多技术问题还在攻克当中,如何更好地把大模型跟自然语言、知识库之间对应上,需要工业界和学术界共同解决。

邱锡鹏:对学术界来讲,数据一直不擅长,我们这方面投入的人力不是很多,基本上以公开数据为主。但是这些公开数据经过一些粗加工,主要以英文居多,中文开放的还不够。我们需要提出数据的衡量标准,来评判什么样的数据是有价值的,包括知识量、知识推理等。

王小川:学术界还有特别被动的地方,因为学术界要通过发论文来证明自己的创新性,论文很多发在英文刊物里,如果学术界要努力做好中文数据,不代表可以在这个评价体系里获胜。所以我们的数据和评价体系,跟西方走了很多,这是特别被动的地方。

孙天澍:再提出一个方向的问题,在国内算力依然非常稀缺的情况下,如何在有限的算力下更好地用好这些算力资源或配置资源,对大模型的基础底座研究做出一些突破?大家能否从产业视角和学术视角做一个分享?

王小川:我认为企业有动力把算力做好,每个行业一旦被扶持,能有百家、千家公司做模型,这是一种很大的消耗,所以还是希望大模型对头部创新有更多帮助。

邱锡鹏:训练这块要适当集中,训练一个比较好的推理端,比如模型训练好之后,我们可以提升很多工作的效率,包括做一些优化、平民化的工作,这些都需要技术支撑。

孙天澍:最近一到两个月,你们有没有看到特别激动人心的大模型,赋能下一代的产品生态?或者是产品应用?

王小川:今年是元年,刚刚开始,在情感陪伴里面大家看到一些成绩。我们公司既做模型,也做应用,内部的医疗模型确实能够更好地做问诊,医疗能力还是蛮惊喜的。

邱锡鹏:我这方面了解的少一点,我觉得 ChatGPT 本身,还是比较惊艳的。因为他们个性化的速度非常快。

孙天澍:我觉得智能体是特别值得关注的一个方向,大家怎么看?

王小川:因为 ChatGPT — 4 到了一定高度之后,智能体就变得非常可行了。国内还是有距离的,国内现在更大的基础工作一方面是追赶 ChatGPT4 的水平,这样才能做智能体。另一方面,追赶过程中,我们开始要做落地的应用。这样的视角会有些不一样。

孙天澍:大模型时代来临后,两位老师对年轻人有哪些建议?

王小川:时代变革的时候,年轻人更有机会。大家只需要用好大模型,就可以一个人变成一个团队,一个人做一个公司,这个机会是属于年轻人的。

邱锡鹏:生成式 AI 给我们提供了非常好的工具,能够使得我们做更多的事。只要你能积极拥抱 AI 技术以及它带来的变化,就非常好了。

孙天澍:最后一个问题,请二位回答一下,大家觉得大模型对我们社会生活的改变,像当年移动互联网智能手机对我们生活的改变,这个时间会来的多快?

王小川:用孙正义的话讲,会用 AI 和不会用 AI 的人就是像人和猴子区别一样,我自己是把 ChatGPT 放在我手机的最底下,每天都会使用。在未来两三年内,我们工作方式、生活方式会有天翻地覆的变化,AI 速度已经到来了,智能体到来之后,跟你工作的可能不只是人,也有机器。

邱锡鹏:我也比较乐观,我觉得三到五年吧。以前电影的类似于 AI 的形象会来到我们真正的现实生活中。

孙天澍:非常感谢二位,在新科技讨论中,我们讨论了 AI 大模型的产业机会、技术突破和未来展望。新一代的 AI 汹涌澎湃,也希望未来大家能够持续关注,能够向小川和邱老师一样,将 AI 融入自己的生活中,持续学习,把科技的未来和自己的未来联系到一起,谢谢大家。

查看原文

文章关键词:ChatGPT,AI大模型,产业机会,技术突破。

Leave a Reply

Your email address will not be published. Required fields are marked *