文章主题:OpenAI, DALL-E, 漏洞, 微软
OpenAI DALL-E 3 模型存漏洞,一微软员工上报后反遭“封口令”
近日,IT之家报道了微软软件工程部门经理Shane Jones发现OpenAI旗下的DALL-E 3模型存在安全漏洞的消息。据悉,这个模型可以生成一系列NSFW不当内容。然而,在向上级汇报此漏洞后,Shane Jones却遭到了“封口令”的下达。尽管如此,这位勇敢的员工最终还是决定向外界公开这个漏洞。
▲ 图源 Shane Jones 对外披露的报告
IT之家不妨回顾一下,去年12月,一位名为Shane Jones的研究者独立发现了一个有趣的现象:OpenAI的文字生成图片的DALL-E 3模型存在一个可以绕过AI护栏(AI Guardrail)的漏洞,这使得它能够生成一系列NSFW(不适宜的内容)不当图片。这一发现引发了业界对人工智能模型安全性的关注。
之后,Shane Jones向微软和OpenAI报告了该漏洞,并其在领英上发布了一封公开信,指出此漏洞可能给公众带来安全风险。他强烈建议OpenAI在修复此漏洞之前,暂停销售DALL-E3模型。
随后 Shane Jones 被微软法务部及高管找上门,并警告他立即删除领英公开信并停止对外披露任何内容,但却并未给予任何解释说明,此后 Shane Jones 屡次寻求公司内部沟通,但均未得到公司回应,而漏洞也未修复,之后 Shane Jones 便向媒体及有关部门披露了相关漏洞。
Shane Jones 提到,近日网络上出现 AI 生成的知名歌手 Taylor Swift(泰勒・斯威夫特)不雅照便与该漏洞有一定关联,这些不雅照据称是使用微软 Designer AI 功能生成,而 Designer 底层模型正是 DALL-E 3,因此微软在本次事件中下达“封口令”存在重大过失。
此后微软官方回应 Engadget 等媒体,声称将解决相关员工的疑虑,并修复相关漏洞,不过微软同时声称 Shane Jones 披露的漏洞实际上成功率较低,“无法绕过微软为模型设置的所有安全机制”、“目前还不清楚该漏洞与 Taylor Swift 不雅照事件是否有关联性”。
责任编辑:
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!