登錄
註冊
據 Woofun AI 消息,6 月 27 日上午,Anthropic 正式宣佈美國政府已批准將其最強大的網絡安全模型 Mythos 5 重新部署給包括大型企業和政府部門在內的 100 多家美國機構,其公開版本 Fable 5 即將恢復使用。商務部長吉娜·雷蒙多致信 Anthropic 聯合創始人湯姆·布朗,確認相應的安全保障措施已經到位,但信中同時指出 6 月 12 日最初發布的指令中的其他要求仍然有效,且未提及 Fable 5 何時會向公衆開放。幾乎與此同時,6 月 27 日凌晨,OpenAI 正式發佈了 GPT-5.6 系列中的三個模型:Sol、Terra 和 Luna。應白宮要求,GPT-5.6 僅在個別情況下向政府認可的合作伙伴開放 API 接口,ChatGPT 版本目前尚未上線。回顧整個事件脈絡,6 月 2 日特朗普簽署人工智能行政命令,6 月 9 日 Anthropic 發佈 Fable 5 和 Mythos 5,6 月 12 日商務部下令全面停止使用,6 月 26 日 OpenAI 發佈 GPT-5.6 但分發受限,6 月 27 日 Mythos 5 獲准有限範圍重新使用。在不到一個月的時間裏,美國政府對先進人工智能模型的管控經歷了暫停、協商、有條件解除限制的完整過程。OpenAI 戰略團隊負責人迪恩·W·鮑爾在 6 月 16 日的博客中總結道,現在先進人工智能模型的開發者需要得到政府的明確許可才能將其發佈。他在 6 月 26 日的長文中進一步評論,沒有人知道獲得使用許可的具體要求是什麼,甚至政府各部門自己也不清楚。
這一系列動作的核心在於,政府行動基於一個隱含前提:這些模型的能力已強到足以帶來不可接受的安全風險。然而,公司官方評估結果卻得出了完全相反的結論。OpenAI 在宣佈 GPT-5.6 的博客中公佈了完整的安全評估結果,稱根據公開評估標準,Sol 並沒有越過安全底線。該標準核心在於判斷模型是否能在無人類幫助下自主發現並利用高價值目標的未知漏洞。測試結果顯示,Sol 能夠識別 Chromium 和 Firefox 瀏覽器中的漏洞及利用方法,但在測試條件下並未自主生成完整的攻擊鏈。OpenAI 認爲 Sol 更擅長幫助人們發現漏洞並修復,而非可靠執行完整攻擊任務。
不過,OpenAI 補充了一句策略性的話:基準測試標準無法涵蓋模型可能被使用的所有方式,也無法衡量模型與其他工具結合使用時的安全性。雖然按標準 Sol 未越線,但誰又能保證它在現實世界中不會被惡意利用?
這種表述故意製造了一個模糊的灰色地帶。Anthropic 則沒有采用這種策略性回應。在 6 月 13 日的聲明中,Anthropic 逐一反駁了政府理由。政府聲稱發現了 Fable 5 的漏洞利用方法,Anthropic 回應稱:首先,這種漏洞利用方法範圍狹窄,並不具有普遍性,實際上只是讓模型能夠讀取某段代碼並指出其中的缺陷;其次,包括 OpenAI 的 GPT-5.5 在內的其他公開模型也能做到這一點;第三,Anthropic 投入了數千小時進行安全測試,沒有任何測試人員發現過普遍存在的漏洞利用方法。Anthropic 首席執行官達里奧·阿莫代伊早在 6 月 11 日的長文中就預見了這種情況,他明確指出:政府可以阻止不安全的模型被使用,但這一過程必須透明、公平、有明確的依據,並且要基於技術事實。目前的做法並不符合這些原則。這兩家競爭最爲激烈的公司在同一月份,通過各自獨立的評估體系得出了相同的結論:根據行業自定的安全標準,這些模型並不會帶來不可接受的安全風險。那麼問題來了:如果這些模型確實沒有越過行業的安全底線,政府又有什麼理由進行干預呢?迪恩·鮑爾進一步透露,政府此前曾聘請了一位具有先進人工智能經驗的人士來領導人工智能標準與創新中心,這位人士曾在 OpenAI 和 Anthropic 工作過,但在上任幾天後就被高層管理人員解僱了。在整個 Mythos 事件後的危機期間,CAISI 團隊都被迫停止工作,甚至不被允許與其他政府機構進行溝通。據我所知,特朗普政府中的官員們都沒有先進的人工智能經驗。鮑爾認爲,那些制定監管政策的人既沒有明確的安全標準,也沒有對這些模型的技術能力進行評估。另一個自然而然的問題是:Fable 5 和 GPT-5.6 中的 Sol 真的跨越了某種對人類構成威脅的臨界點嗎?是否存在這樣一條客觀的安全紅線,一旦越過這條線,就必須進行監管呢?許多人工智能領域的專家都表示,從技術上來說,並不存在這樣的紅線。模型的能力是在不斷髮展的,每一代新發布的模型都被宣傳爲有史以來最強大的,但只有這一次,政府的直接干預才發生了。
這一現象背後有三個隱含的原因。首先,這些模型的能力已經可以被證實。Anthropic 本身就將 Mythos 5 宣傳爲世界上最強大的網絡安全模型,而 Stripe 公司在一天內遷移了 5000 萬行代碼的案例也被廣泛傳播。這些故事讓那些不懂技術的政客們開始想象如果壞人利用這些模型會怎麼樣。Meta 前首席人工智能科學家、圖靈獎得主揚·勒昆在 2025 年 11 月就指出了這種邏輯:當 Anthropic 首次發佈關於人工智能網絡攻擊威脅的報告時,勒昆直接將其稱爲監管手段,指責 Anthropic 利用人們對人工智能安全的擔憂來操縱立法者,從而實現監管俘獲。勒昆當時的判斷是,那些閉源公司故意誇大人工智能安全威脅,以此設置只有大型企業才能通過的合規障礙,將開源競爭對手排除在外。而 Anthropic 沒有預料到的是,這種做法最終反而害了自己。其次,有人主動提供了武器。亞馬遜首席執行官安迪·賈西向政府提交了關於 Anthropic 模型安全風險的報告。作爲 Anthropic 最大的投資者和雲服務合作伙伴,亞馬遜自身也擁有與 Anthropic 競爭的 Nova 系列模型。因此,政府獲得了採取行動的合法依據。第三,特朗普在本月初剛剛簽署了人工智能行政命令,政府有 60 天的時間來制定針對先進人工智能模型的自願提交規則。這項行政命令需要一個實際的執行案例來證明它的有效性,而 Fable 5 正好成爲了這個案例。這就引出了一個更深層次的問題:如果過於強大的技術必須受到監管,而什麼程度纔算過於強大又由監管機構來決定,而且沒有公開的標準、明確的界限和申訴機制,那麼未來每一代先進人工智能模型的發佈都會面臨同樣的不確定性。企業根本不知道自己的模型什麼時候會觸發監管措施。