推理成稀缺资源：Nvidia 财报重构与 Hyperbolic 崛起

2026-06-08 23:35

2023 年，Sequoia 的 David Cahn 提出'2000 亿美元难题'，指出每投入 1 美元购买 GPU，需再投入 1 美元用于数据中心支持，导致投资与终端支付间存在超 1250 亿美元缺口。一年后，随着大型云厂商资本支出激增，Cahn 将此问题升级为'6000 亿美元难题'，警示过度建设将引发供应过剩与资本损失。

然而，市场焦点已从训练环节的产能过剩，悄然转向推理环节的资源稀缺性，这一转变正被最新的市场定价所确认。

Cerebras 的 IPO 成功成为这一趋势的标志性事件，其发行价格接近最终定价的两倍，并录得 20 倍超额认购率。投资者追捧的并非其取代 Nvidia 的潜力，而是其专注于推理加速的芯片架构。摩根大通估算，推理市场规模可达训练市场的 10 至 50 倍，因为训练是一次性成本，而推理是伴随智能体（Agent）自主执行任务而持续产生的重复性成本。这种从'一次性构建'到'持续运行'的范式转移，彻底改变了计算产业链的价值分布逻辑。

午方 AI 注意到，Nvidia 在最新财报中已明确将业绩拆分为数据中心与边缘计算两大板块，其中数据中心营收达 750 亿美元，同比增长 92%，而边缘计算业务虽仅占不到 8% 的份额，却被提升至战略高度。Jensen Huang 在电话会议中强调，智能体 AI 的兴起使得计算能力直接等同于营收，并预告专为智能体设计的 Vera 处理器将在第三季度上市，其推理性能最高可达 Blackwell 处理器的 35 倍，预计总市场规模达 2000 亿美元。这一战略调整表明，推理市场正分化为云端服务与边缘设备协同的双轮驱动模式。

推理资源的紧缺已在应用层显现。Anthropic 因用户量超出配置上限，面临大量关于 Claude 系统延迟的投诉，被迫于 2026 年 5 月接管配备超 22 万块 Nvidia GPU 的 Colossus 1 数据中心，专门用于推理任务。随后，Anthropic 多次调整使用限制，并于 6 月 15 日推出独立计费机制，对智能体应用按 API 调用次数收费，标准定为每月 20 至 200 美元。这一系列动作证实，智能体应用对计算资源的消耗速度已远超传统订阅模式的承载能力，必须转向基于实际使用量的定价策略。

午方 AI 梳理发现，整个 AI 计算产业链呈现六层结构，从台积电的晶圆制造延伸至 API 接口，大多数企业仅占据单一环节。

然而，Hyperbolic 作为例外，在 2025 年 6 月推出的按需租赁服务中，已覆盖 GPU 租赁、部署及模型 API 三层结构。尽管不拥有任何物理 GPU，Hyperbolic 通过聚合 neocloud、Data Centers 等数十家供应商的闲置资源，构建了标准化的资源池，使开发者能实时获取最优价格。这种多云聚合能力使其在供需波动中具备先发优势，甚至计划未来利用数据预测价格走势，扮演物理计算能力的做市商角色。

相比之下，Venice 作为应用层代表，虽拥有约 13.6 万个独特钱包地址和每日 33 万次访问量，但其商业模式本质是转售隐私保护服务而非计算资源本身。Venice 从上游租用计算资源并支付模型费用，其毛利润高度依赖隐私溢价，且受闭源模型接口价格波动影响显著。午方 AI 分析认为，若将 Venice 比作加油站，Hyperbolic 则是炼油厂，后者通过整合零散资源并优化路由，在推理需求爆发期占据了更高的价值链位置。随着智能体 AI 推动计算需求呈指数级增长，最终胜出的将不是拥有最多硬件的企业，而是能精准调度全球最廉价算力的高效聚合者。

免责声明：本内容为作者独立观点，不代表平台立场。未经允许不得转载，文中内容仅供参考，不作为实际操作建议，交易风险自担。

WOOFUN.AI 你的加密智能助理。以智能技术重构加密体验，化繁为简，打破专业门槛，让每个人都能安心、聪明、快乐地拥抱数字未来。

iOS

Google Play

Android Apk

市场生态 Alpha 失乐园评级资讯快讯日历交易所钱包