登錄
註冊
據 Woofun AI 消息,美國加密貨幣巨頭 Coinbase 首席執行官布萊恩·阿姆斯特朗近期披露,公司已將核心 AI 模型切換至中國的 GLM 5.2 與 Kimi 2.7,此舉直接導致其 AI 相關支出縮減 50%。
這一決策並非源於業務萎縮,相反,在成本腰斬的同時,Coinbase 的 token 使用量反而呈現上升趨勢。這種'降本增效'的反常現象,正在讓 OpenAI 與 Anthropic 等硅谷傳統巨頭感到前所未有的焦慮,標誌着 AI 基礎設施選型邏輯的根本性逆轉。
實現這一驚人降本效果的核心,在於 Coinbase 構建了一套精密的'成本節約系統',而非簡單的模型替換。首先,公司部署了自動路由系統,該機制能根據任務複雜度、實時價格及緩存狀態動態匹配模型,確保簡單翻譯任務由廉價模型處理,而高難度推理才調用高性能模型,徹底摒棄了'一刀切'的資源浪費。其次,通過深度優化緩存策略,Coinbase 將緩存命中率從原本的 5% 激增至 60%,這意味着六成請求可直接複用歷史計算結果,大幅削減了單次請求的實際算力成本。最後,團隊全面推行'上下文工程',要求開發人員爲不同任務開啓獨立會話並精簡背景信息,避免在單次對話中堆砌冗餘內容。Anthropic 在其技術博客中也承認,在管理 AI 智能體時,這種上下文工程策略比傳統的提示工程更爲高效,其本質在於爲模型提供精準信息而非單純追求模型智商的提升。
這一趨勢已迅速從 Coinbase 擴散至整個科技行業,多家企業開始實測中國模型的性價比。擁有 25 名員工的 AI 初創公司 Lindy 已全面棄用 Claude,轉而採用 DeepSeek,其首席執行官 Flo Crivello 向 CNBC 坦言,AI 成本超過人力成本的局面已不可持續,模型切換後爲公司節省了數百萬美元。Snowflake 首席執行官斯里達·拉馬斯瓦米則進行了嚴謹的對比測試:在 103 項編碼任務中,GLM-5.2 的完成率爲 66%,而 Claude Opus 4.7 爲 67%,兩者性能差異微乎其微。
然而價格鴻溝卻觸目驚心:Woofun AI 整理數據顯示,GLM-5.2 的輸入與輸出成本分別爲 1.40 美元和 4.40 美元,而 Claude Opus 4.7 分別爲 5 美元和 25 美元,GPT-5.5 更是高達 5 美元和 30 美元,輸出價格差距高達 5 至 7 倍。
儘管價格優勢顯著,但質量與穩定性的博弈依然存在。Snowflake 的測試數據揭示,GLM-5.2 在部分任務上的首次嘗試成功率僅爲 47.6%,低於 Opus 的 53.7%。
更關鍵的是,GLM 偶爾會出現'固執'的錯誤路徑,例如在某項任務中耗時 24 分鐘、經過 411 次嘗試後仍告失敗,而 Opus 僅用 9 分鐘、49 次嘗試便成功完成。
不過,在大多數常規任務中,兩者的最終成功率幾乎持平。對於企業決策者而言,核心問題已轉化爲是否願意爲幾個百分點的穩定性溢價支付 5 倍成本,越來越多的答案指向否定。對於普通用戶,這一變革同樣具有啓示意義:不應固守 ChatGPT 或 Claude 單一工具,而應像專業用戶一樣,根據任務類型靈活切換模型;
同時,善用緩存機制處理重複任務,並通過簡化上下文信息來提升交互效率,避免在海量歷史記錄中徒勞搜索。
這場模型遷移浪潮正在從根本上重塑 AI 行業的定價邏輯。OpenAI 與 Anthropic 的高估值曾建立在營收持續高速增長的假設之上,但隨着 Coinbase 和 Lindy 等巨頭轉向高性價比替代方案,這一假設正面臨嚴峻挑戰。市場已出現價格戰苗頭,OpenAI 在最新推出的 GPT-5.6 系列中,Terra 模型價格僅爲 GPT-5.5 的一半,Luna 模型則主打極致低價。當美國科技巨頭開始大規模採用中國模型以降低成本時,AI 領域的競爭焦點已從實驗室的基準測試徹底轉向真實的成本之戰,能夠以更低價格完成同等任務,已成爲新的核心競爭力。