登錄
註冊
人工智能行業正陷入一種深刻的悖論:企業高層在會議中嚴肅警告技術失控風險,呼籲加強監管,但散會後卻加速推出更強大的模型。這種'早上警告、下午加速'的循環,揭示了行業在安全承諾與商業競爭之間的撕裂。Anthropic 最新推出的 Fable 5 模型便是這一矛盾的集中爆發點。該模型於 6 月 9 日上線,僅運行三天,便在 6 月 12 日下午接到美國政府電話,被給予 90 分鐘緩衝期後,於當晚 17 時 21 分被正式強制下線。政府命令明確指出,無論身處何地,包括 Anthropic 的外籍員工在內,均不得繼續使用此模型,理由直指'國家安全'。
Fable 5 的下線並非偶然,其核心原因在於該模型實爲 Anthropic 未公開的 Mythos 模型的'安全版本'。儘管 Anthropic 試圖通過安全機制防止模型被用於網絡攻擊或危險科研,但亞馬遜向美國政府提交的一份報告指出,Fable 5 的安全限制可被突破,從而直接訪問底層的 Mythos 模型。午方 AI 梳理發現,正是這種'可被繞過'的潛在風險,觸發了政府的極端干預措施。這暴露了 Anthropic 在技術架構上的致命弱點:試圖在保持 Mythos 強大能力的同時構建安全圍欄,卻未能完全隔絕風險。儘管 Anthropic 自詡爲全球最重視風險管理的企業,甚至曾主動呼籲政府有權阻止危險模型,但最終第一個被政府叫停的卻是自家產品。
這一事件深刻反映了 AI 治理中的責任碎片化困境。亞馬遜指出了風險,政府出於國家安全採取行動,Anthropic 也試圖履行安全義務,但各方行動並未形成合力,反而導致了混亂。Fable 5 的迅速關停恰恰證明,沒有任何一方願意主動放慢發展速度,必須依賴外部強制力才能踩下剎車。更諷刺的是,當強制措施實施後,僅 Anthropic 的模型被停用,其他競爭對手的模型仍在正常運行。午方 AI 注意到,這種'選擇性執法'表明,所謂的行業放緩只是假象,真正的技術競賽從未停止,且無人能有效遏制其加速趨勢。
從技術演進角度看,Fable 5 的失敗源於其先天不足。Anthropic 真正先進的模型是 Mythos,因其能力過於強大而未公開。2026 年 4 月,公司曾通過 Project Glasswing 向選定機構提供 Mythos 預覽版以尋找漏洞,但漏洞利用與惡意攻擊之間的界限始終模糊。到了 6 月,Anthropic 選擇將部分能力公開,將高風險操作轉嫁給限制更嚴格的 Opus 4.8 模型。
然而,Opus 4.8 作爲商業產品,需面對定價、銷售策略等市場壓力,這與'安全性優先'的理念存在天然衝突。午方 AI 分析認爲,試圖讓'跑得比別人快'的競爭邏輯與'不能跑太快'的安全邏輯共存,在缺乏行業共識的情況下注定難以實現。
Anthropic 的創始團隊多來自 OpenAI,親歷了 Altman 被解僱又迴歸、董事會重組以及 Superalignment 團隊解散等動盪。他們深知模型能力指數級增長背後的隱患,因此推出了《2026 年負責任的可擴展治理政策》3.0 版,主張政府應有權干預危險模型。
然而,Fable 5 事件粉碎了這種對'看不見的手'的幻想。今年早些時候,Anthropic 曾與五角大樓就 Claude 模型的軍事用途發生爭執,拒絕將其用於大規模監控或自主武器,但國家安全體系認爲這種'界限'本身即存在隱患。當連'剎車'的定義都無法統一時,責任便無從談起。
Fable 5 上線後,首先遭遇的並非政府壓力,而是安全專家的質疑。IBM X-Force 研究員 Chompie 指出,該模型的安全機制過於敏感,常因無關請求觸發警報,無法區分用戶意圖。兩天後,美國政府介入,Anthropic 對此感到錯愕,因爲他們此前已獲政府許可並參與測試,且認爲漏洞已知且可控。
然而,政府僅基於口頭陳述便做出關停決定,未提供具體細節。這種信任鏈條的斷裂,使得 Anthropic 陷入進退維谷的境地:既無法滿足開發者的期待,也無法完全符合政府的嚴苛要求。
這一事件折射出 AI 時代的深層危機:責任被分割成無數碎片,包括內部管控、模型評估、出口管制、投資回報等,每一方都認爲自己盡到了責任,但整體卻無人承擔。正如 1914 年德國皇帝威廉二世試圖改變軍事動員時間表卻遭參謀總長拒絕的故事,現代戰爭機器一旦啓動便難以控制。午方 AI 研判指出,AI 發展亦如這列失控的列車,計算能力、資本野心與國家博弈交織推動其前行。雖然剎車裝置始終存在,但站在道岔旁的人卻拒絕觸碰它。Fable 5 的悲劇在於,它本應成爲行業反思的契機,但在其下線之時,新的更強模型已接踵而至,無人願意率先停下腳步。