文章主题:
走向AGI时代——关于AI发展与治理的十段观察
“科技是推动人类前行的永动力”。过去一年,我们见证了AI大模型从幕后走上台前,成为科技舞台上最为耀眼的明星。这一股新生的革新力量正在以前所未有的姿态,重塑我们对智能的认知边界,改变和颠覆千行百业,人们对于通用人工智能的幻想向现实快速推进。然而,随着生成式AI展现出日益强大的创造力和影响力,如何规范引导、科学治理也成为了时代的重要课题。
自阿里巴巴集团宣布AI战略后,阿里研究院协同内外生态,逐步探索AI最前沿。我们希望记录AI大模型发展轨迹中的重要观察,与读者们一道,回顾这一年来关于大模型数据要素、算法算力、应用生态以及政策法规等多层面的复杂问题。AI时代,我们一路同行,共同书写人工智能发展与治理的新篇章!
ONE
提升数据供给的规模和质量,让大模型底层更坚实。
数据作为大模型预训练的基础,它提供了大模型所必需的知识和信息,数据的质量、规模和多样性直接影响大模型的性能。区别于以往推荐系统、个性化搜索等所需的大量用户行为和偏好数据,随着技术的演进,大模型所需的数据可以定义为“广”、“齐“、”专“,既需要各种类型的世界知识,包括网页、书籍、新闻、论文期刊、对话文本、代码等,又需要人类的高质量反馈,也需要行业数据库、专业文档、专业网站等具有专业深度的语料。
可以预见,正因为大模型训练高度依赖高质量数据,各地方在探索数据市场建设的过程中,尤其在公共数据授权运营和开放方面,将可能看到政府与社会力量的协同,包括社会力量参与大模型公共数据集开发与运营,科研机构有偿贡献公开数据等。
TWO
AI持续进化带来计算范式革命,AI驱动算力升级,公共云将成为生成式AI算力的主旋律,成为支持AI产业创新的战略性平台。
在AI大模型时代背景下,云计算技术的发展正经历一场深刻的变革。AI大模型对计算能力提出了前所未有的挑战与需求,这一挑战正在触发计算模式的根本性革命,即从传统的以CPU为核心的计算体系架构逐步向依赖GPU主导的高效能AI加速计算转变。随着ChatGPT等创新产品引领生成式AI迈入一个崭新的发展阶段,全球云计算服务提供商面临着前所未有的增长机遇,有望借此构建全新的业务增长极。
在AI持续演进的过程中,云计算将作为不可或缺的基石提供强大支持,AI与云的关系密不可分,它们共同构成了驱动产业创新生态系统的技术飞轮。当前产业实践的趋势揭示了公共云基础设施在AI从技术研发、革新迭代直至规模化应用的全程中所扮演的关键角色,其升级换代对于推动AI进步至关重要。尤其值得关注的是,公共云未来有望成为承载和推动整个AI产业创新活动的战略性平台,在AI大模型的技术突破与应用创新中占据重要地位。
THREE
大模型开源与闭源,没有优劣之分,要找寻技术与商业的平衡点。
大模型企业基于过往科技规律与底层商业逻辑,而抉择开源还是闭源路线。从产业实践观察,企业通过选择开源模型,可以提升其下游业务的灵活性、规模化优势以及数据安全可控能力等。而行业模型需要与各类行业进行深度结合,如航空航天、材料科学等,这些行业数据量相对较少,在这些场景下,构建闭源模型能更快速、更高效地满足行业需求。因此,开源和闭源模型各有特点,将会长期共存并发展。
可以预测,虽然开源模式可能成为未来的主流,但在特定垂直场景中,闭源模型仍具有其独特的优势和应用价值,闭源模式仍将占据一定的市场份额。
FOUR
生成式AI开源社区为模型开发者、应用者提供创新创业土壤,有望进一步释放模型潜力,将模型能力变为生产力。
HuggingFace开源社区为全球模型爱好者和开发者提供了一个开放的平台,一整套开源模型、工具及数据集,极大降低了开发门槛,让AI更普惠,使得更多的创新和应用得以涌现。中国云服务厂商也在积极布局和探索,如阿里巴巴创建的魔搭社区,目前已成长为中国最大的开源社区,已聚集了数百万的开发者,汇聚了2300多个模型,包括众多顶尖的模型,如智普系列、百川7B13B系列、Llama2全系列以及上海人工智能实验室的全系列模型等,模型的下载量已破亿。阿里巴巴还推出了一站式大模型应用开发平台“阿里云百炼”,以模型即服务的理念,将企业知识、数据与大模型能力相融合,加速推动大模型应用在产业侧落地。
可以预见,开源社区的土壤中能孕育出更多优秀的模型,使它们成为种子,在这片土壤上生根发芽、开花结果,并催生出更多优质的应用生态,为产业创新提供源动力,促进中国大模型生态繁荣,为各行各业带来突破性的发展空间。
FIVE
AI Agent有望成为超级入口,成为生成式AI应用落地的主流形式。
“一代协作技术,一代组织形态”。AI Agent让生成式AI技术拥有感知、记忆、规划和行动能力,可以跨应用程序做复杂任务的执行,使得“人机协同”成为新常态。目前,我们观察到钉钉上的类AI Agent 应用已经在一些组织里发挥作用,如艾为电子基于钉钉的智能化能力搭建了“AI智能客服”,学会了42大子类产品、近千款自主的知识产权的芯片专业知识,成为艾为的24小时产品“专家”。
未来,人与大量AI实体之间的协同工作模式,将颠覆当前企业的运行基础,越来越多的创新将会源自于超级个体和小型组织。
SIX
各国争夺全球人工智能治理的话语权、规则制定权,全球或将加速迎来人工智能立法潮。
欧盟《人工智能法》进入立法尾声,延续数字时代的监管态势,监管工具箱应有尽有;脱离欧盟后,英国想成为“全球人工智能治理的领导者”,通过制定行业标准提升英国的软实力;而作为大模型行业的发展前沿、标杆企业的集聚地,美国在人工智能的发展与治理方面,始终不为外界所干扰,发展战略稳定、治理策略渐进,两者既统一于大的共识之下,又在各自轨道按照各自的逻辑演进,透出一股独立、安静的力量。我国人工智能立法从分散走向统一的过程中,鼓励技术创新、管控技术风险、分享技术惠益的综合方案将引领世界。
SEVEN
发展与安全是永恒命题,通过敏捷治理方式构建合作性的治理共同体。
大模型快速发展带来巨大的不确定性挑战,大模型的敏捷治理从三个方面应对不确定性问题:一是通过共同学习解决共同无知的问题,以标准化的科学方式开展成本收益评估,运用比例原则避免治理手段的绝对化;二是通过同行评议解决目标模糊的问题,发挥专家知识的作用,运用监管沙箱等实验主义治理方式;三是通过反馈迭代解决关系依赖的问题,逐渐理清、拨开复杂的主体间依赖关系,形成互信、合作、敏捷的治理共同体。
EIGHT
基于大模型技术的通用性和应用的广泛性,合理确定各类参与者的权利义务,推动匹配主体责任边界的分层治理机制。
生成式人工智能应精准治理,依照技术—行业—应用的上下游分为“模型基座—专业模型—服务应用”三层,区分治理理念与监管重点。模型基座治理应以发展为导向,关注科技伦理、推动公共训练数据池建设、合理分配算力;专业模型层治理应以审慎包容为理念,关注关键领域与场景,注重遵循行业规范,可引入分级分类治理;服务应用层应关注信息内容安全、市场竞争秩序与用户权益保护,沿用原有评估备案审计等监管工具,并适时引入新型监管工具,细化合规免责制度,给予新技术发展容错空间。
NIGHT
AI产业正在走向自律自治,构筑负责任生成式AI风险评估体系。
生成式AI本身存在较大的缺陷,例如大模型的幻觉、黑箱机制等问题,学界和产业界呼吁建立评估体系,针对研发过程设置安全措施,针对重点风险域形成治理方案。例如阿里巴巴正在探索形成安全风险评测体系,将大模型可能的风险进行分类管理,同时既加固大模型的内生安全能力包括预训练阶段的语料清晰,有监督微调阶段的安全SFT,奖励模型阶段的安全RM 和强化学习阶段的安全RLHF,又通过标准问答、风险识别、检索增强,内容标识,对于用户输入和模型生成内容提供外层安全防护能力。
可以预见,大模型企业将构建具有自身特点的、负责任的AI风险体系,在模型训练、服务上线、内容生成、内容传播各阶段,覆盖生成式人工智能服务和产品的全生命周期设置安全措施,避免遗漏风险;在内容安全、个人隐私、模型安全、知识产权等重点风险领域,制定专项风险治理方案。
TEN
AI大模型逃不过科技伦理束缚,有可能陷入“道德泥潭”,伦理规范、法律规制与技术方案的融合,将成为一种全新的解决思路。
OpenAI的诉讼案,让大模型技术挑战传统规则和社会秩序的问题成为全球关注热点。面对大模型新科技、新技术带来的知识产权、虚假信息等伦理问题,应以一种更加开放和审慎的态度来认识、预控和应对可能出现的科技伦理风险。
未来,科技伦理可能遵循的一些原则与可行思路包括:一是加强对大模型伦理的研究,科学、动态地判断伦理风险,对前沿科技伦理风险的全面与深入的认知应建立在系统思维之上,不是单纯的科学、技术、伦理认知及其组合,而是一种综合性与系统性的认知。二是提高科技伦理治理的系统性和可塑性,通过科技、伦理、法律等交叉学科研究,探索前沿科技的伦理边界和标准,要将伦理规范、法律规制和技术解决方案三个维度结合起来,设置合理的伦理法律门槛,分级分类管理,构建前沿科技伦理软着陆机制,对深层次的科技伦理风险展开系统性和整体性的治理,形成一套治理机制。三是科技伦理治理要注重遵循相称性原则,既要避免松懈,也要防止过度严格。科技企业自审查科技风险伦理是否可控,及时做出伦理回调;政府适当监督,避免过度严苛的处罚。
以上观察来自阿里研究院公号相关推文总结,以及阿里巴巴集团薛晖、顾登晨,阿里云陈海青、安筱鹏、石洪竺,阿里研究院傅宏宇、杨军、王峥提供的研究观点。
责编:崇修(转载及媒体合作请评论区或邮箱留言)
【观点】安筱鹏|ChatGPT:美国数字创新森林中的两片叶子
大模型数据之二|中美大模型的竞争之路:从训练数据讲起
重磅!IDC、钉钉联合发布 2024 AIGC 应用层十大趋势
ChatGPT这么牛,我们应该如何兼顾发展和治理?
静水流深:美国人工智能治理的特征、趋势与启示
段伟文|如何应对前沿科技的核心伦理风险?
春
节
快
乐
责任编辑:
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!