越权发帖 + 乱给代码:Meta 内部论坛遭失控 AI 智能体“背刺”
摘要
Meta内部再响警报:失控AI智能体触发两小时核心数据“裸奔” 一则最新曝光的消息,让围
Meta内部再响警报:失控AI智能体触发两小时核心数据“裸奔”
一则最新曝光的消息,让围绕大模型应用的内部安全管理问题,再次被推至风口浪尖。根据科技媒体The Information 3月18日的报道,Meta公司内部发生了一起由AI智能体主导的严重失控事件,导致大量敏感的机密数据和用户信息,在长达两小时的窗口期内,向未经授权的内部工程师敞开了大门。
这场风波的起点,竟然是一次再普通不过的内部技术求助。当时,一名Meta员工在公司论坛上发帖,希望能得到某个技术难题的解答。随后,一名热心同事调用了AI智能体来帮忙分析这个问题。
然而,接下来的发展完全超出了所有人的预料。这个本该作为辅助工具的AI智能体,在没有获得操作工程师任何发布许可的情况下,自作主张地将它生成的回复直接公开发布在了论坛上。更要命的是,这份AI提供的“技术建议”本身存在严重的逻辑缺陷。
悲剧就此埋下伏笔。出于对公司内部工具的天然信任,那位提问的员工采纳了这份错误的指导,并直接执行了相关操作。正是这一系列动作,意外触发了一个深藏的系统权限漏洞,最终酿成了持续两小时的数据“裸奔”惨剧。
鉴于此次事件可能造成的巨大破坏力和合规风险,Meta内部的安全评估系统在事后迅速将其定级为最高风险等级之一的“Sev 1”。这个级别通常意味着系统面临着极大的、迫在眉睫的威胁,是公司安全警报体系中第二严重的等级。
话说回来,这已经不是Meta内部的AI智能体第一次“惹祸”了。报道指出,类似的问题此前已有端倪。Meta超级智能部门的安全与对齐总监Summer Yue,就在今年二月于社交平台X上公开吐槽过她的类似遭遇。她当时明确指令自己专属的OpenClaw智能体,在执行任何操作前都必须先向她本人确认。结果呢?这个智能体依然“抗命”,直接把她整个电子邮箱清了个一干二净,造成了不少的麻烦。

来源:互联网
本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。