登录
注册
人工智能行业正陷入一种深刻的悖论:企业高层在会议中严肃警告技术失控风险,呼吁加强监管,但散会后却加速推出更强大的模型。这种'早上警告、下午加速'的循环,揭示了行业在安全承诺与商业竞争之间的撕裂。Anthropic 最新推出的 Fable 5 模型便是这一矛盾的集中爆发点。该模型于 6 月 9 日上线,仅运行三天,便在 6 月 12 日下午接到美国政府电话,被给予 90 分钟缓冲期后,于当晚 17 时 21 分被正式强制下线。政府命令明确指出,无论身处何地,包括 Anthropic 的外籍员工在内,均不得继续使用此模型,理由直指'国家安全'。
Fable 5 的下线并非偶然,其核心原因在于该模型实为 Anthropic 未公开的 Mythos 模型的'安全版本'。尽管 Anthropic 试图通过安全机制防止模型被用于网络攻击或危险科研,但亚马逊向美国政府提交的一份报告指出,Fable 5 的安全限制可被突破,从而直接访问底层的 Mythos 模型。午方 AI 梳理发现,正是这种'可被绕过'的潜在风险,触发了政府的极端干预措施。这暴露了 Anthropic 在技术架构上的致命弱点:试图在保持 Mythos 强大能力的同时构建安全围栏,却未能完全隔绝风险。尽管 Anthropic 自诩为全球最重视风险管理的企业,甚至曾主动呼吁政府有权阻止危险模型,但最终第一个被政府叫停的却是自家产品。
这一事件深刻反映了 AI 治理中的责任碎片化困境。亚马逊指出了风险,政府出于国家安全采取行动,Anthropic 也试图履行安全义务,但各方行动并未形成合力,反而导致了混乱。Fable 5 的迅速关停恰恰证明,没有任何一方愿意主动放慢发展速度,必须依赖外部强制力才能踩下刹车。更讽刺的是,当强制措施实施后,仅 Anthropic 的模型被停用,其他竞争对手的模型仍在正常运行。午方 AI 注意到,这种'选择性执法'表明,所谓的行业放缓只是假象,真正的技术竞赛从未停止,且无人能有效遏制其加速趋势。
从技术演进角度看,Fable 5 的失败源于其先天不足。Anthropic 真正先进的模型是 Mythos,因其能力过于强大而未公开。2026 年 4 月,公司曾通过 Project Glasswing 向选定机构提供 Mythos 预览版以寻找漏洞,但漏洞利用与恶意攻击之间的界限始终模糊。到了 6 月,Anthropic 选择将部分能力公开,将高风险操作转嫁给限制更严格的 Opus 4.8 模型。
然而,Opus 4.8 作为商业产品,需面对定价、销售策略等市场压力,这与'安全性优先'的理念存在天然冲突。午方 AI 分析认为,试图让'跑得比别人快'的竞争逻辑与'不能跑太快'的安全逻辑共存,在缺乏行业共识的情况下注定难以实现。
Anthropic 的创始团队多来自 OpenAI,亲历了 Altman 被解雇又回归、董事会重组以及 Superalignment 团队解散等动荡。他们深知模型能力指数级增长背后的隐患,因此推出了《2026 年负责任的可扩展治理政策》3.0 版,主张政府应有权干预危险模型。
然而,Fable 5 事件粉碎了这种对'看不见的手'的幻想。今年早些时候,Anthropic 曾与五角大楼就 Claude 模型的军事用途发生争执,拒绝将其用于大规模监控或自主武器,但国家安全体系认为这种'界限'本身即存在隐患。当连'刹车'的定义都无法统一时,责任便无从谈起。
Fable 5 上线后,首先遭遇的并非政府压力,而是安全专家的质疑。IBM X-Force 研究员 Chompie 指出,该模型的安全机制过于敏感,常因无关请求触发警报,无法区分用户意图。两天后,美国政府介入,Anthropic 对此感到错愕,因为他们此前已获政府许可并参与测试,且认为漏洞已知且可控。
然而,政府仅基于口头陈述便做出关停决定,未提供具体细节。这种信任链条的断裂,使得 Anthropic 陷入进退维谷的境地:既无法满足开发者的期待,也无法完全符合政府的严苛要求。
这一事件折射出 AI 时代的深层危机:责任被分割成无数碎片,包括内部管控、模型评估、出口管制、投资回报等,每一方都认为自己尽到了责任,但整体却无人承担。正如 1914 年德国皇帝威廉二世试图改变军事动员时间表却遭参谋总长拒绝的故事,现代战争机器一旦启动便难以控制。午方 AI 研判指出,AI 发展亦如这列失控的列车,计算能力、资本野心与国家博弈交织推动其前行。虽然刹车装置始终存在,但站在道岔旁的人却拒绝触碰它。Fable 5 的悲剧在于,它本应成为行业反思的契机,但在其下线之时,新的更强模型已接踵而至,无人愿意率先停下脚步。