登录
注册
2023 年,Sequoia 的 David Cahn 提出'2000 亿美元难题',指出每投入 1 美元购买 GPU,需再投入 1 美元用于数据中心支持,导致投资与终端支付间存在超 1250 亿美元缺口。一年后,随着大型云厂商资本支出激增,Cahn 将此问题升级为'6000 亿美元难题',警示过度建设将引发供应过剩与资本损失。
然而,市场焦点已从训练环节的产能过剩,悄然转向推理环节的资源稀缺性,这一转变正被最新的市场定价所确认。
Cerebras 的 IPO 成功成为这一趋势的标志性事件,其发行价格接近最终定价的两倍,并录得 20 倍超额认购率。投资者追捧的并非其取代 Nvidia 的潜力,而是其专注于推理加速的芯片架构。摩根大通估算,推理市场规模可达训练市场的 10 至 50 倍,因为训练是一次性成本,而推理是伴随智能体(Agent)自主执行任务而持续产生的重复性成本。这种从'一次性构建'到'持续运行'的范式转移,彻底改变了计算产业链的价值分布逻辑。
午方 AI 注意到,Nvidia 在最新财报中已明确将业绩拆分为数据中心与边缘计算两大板块,其中数据中心营收达 750 亿美元,同比增长 92%,而边缘计算业务虽仅占不到 8% 的份额,却被提升至战略高度。Jensen Huang 在电话会议中强调,智能体 AI 的兴起使得计算能力直接等同于营收,并预告专为智能体设计的 Vera 处理器将在第三季度上市,其推理性能最高可达 Blackwell 处理器的 35 倍,预计总市场规模达 2000 亿美元。这一战略调整表明,推理市场正分化为云端服务与边缘设备协同的双轮驱动模式。
推理资源的紧缺已在应用层显现。Anthropic 因用户量超出配置上限,面临大量关于 Claude 系统延迟的投诉,被迫于 2026 年 5 月接管配备超 22 万块 Nvidia GPU 的 Colossus 1 数据中心,专门用于推理任务。随后,Anthropic 多次调整使用限制,并于 6 月 15 日推出独立计费机制,对智能体应用按 API 调用次数收费,标准定为每月 20 至 200 美元。这一系列动作证实,智能体应用对计算资源的消耗速度已远超传统订阅模式的承载能力,必须转向基于实际使用量的定价策略。
午方 AI 梳理发现,整个 AI 计算产业链呈现六层结构,从台积电的晶圆制造延伸至 API 接口,大多数企业仅占据单一环节。
然而,Hyperbolic 作为例外,在 2025 年 6 月推出的按需租赁服务中,已覆盖 GPU 租赁、部署及模型 API 三层结构。尽管不拥有任何物理 GPU,Hyperbolic 通过聚合 neocloud、Data Centers 等数十家供应商的闲置资源,构建了标准化的资源池,使开发者能实时获取最优价格。这种多云聚合能力使其在供需波动中具备先发优势,甚至计划未来利用数据预测价格走势,扮演物理计算能力的做市商角色。
相比之下,Venice 作为应用层代表,虽拥有约 13.6 万个独特钱包地址和每日 33 万次访问量,但其商业模式本质是转售隐私保护服务而非计算资源本身。Venice 从上游租用计算资源并支付模型费用,其毛利润高度依赖隐私溢价,且受闭源模型接口价格波动影响显著。午方 AI 分析认为,若将 Venice 比作加油站,Hyperbolic 则是炼油厂,后者通过整合零散资源并优化路由,在推理需求爆发期占据了更高的价值链位置。随着智能体 AI 推动计算需求呈指数级增长,最终胜出的将不是拥有最多硬件的企业,而是能精准调度全球最廉价算力的高效聚合者。