登录
注册
过去三年,人工智能计算领域的叙事几乎完全被 GPU 垄断,从 NVIDIA 的 H100、H200 到 GB200、GB300,再到各大云厂商部署的万卡集群,CPU 长期被视为仅处理边缘任务的辅助角色。
然而,这一格局在 2026 年 6 月 1 日出现转折,英特尔在北京正式推出专为云原生、智能边缘及高并发网络任务设计的 Xeon 6+ 处理器。作为首款基于 18A 工艺制造的数据中心 CPU,该产品被英特尔定义为 AI 基础设施中的'协调者',而非 GPU 的'补充品',其核心职责转向任务调度、并发控制及数据流管理。英特尔数据中心业务执行副总裁兼总经理 Kevork Kechichian 在发布会上强调,随着 AI 进入智能边缘计算时代,上述非计算密集型任务已成为新的瓶颈,这再次印证了 CPU 作为现代 AI 基础设施控制中心的核心地位。
这种观点并非英特尔的孤例,独立半导体研究机构 SemiAnalysis 在今年 2 月发布的《CPU 的回归》报告中也得出了类似结论。午方 AI 梳理发现,CPU 的'回归'并非指其重新成为算力焦点,而是角色被重新定义。要理解这一转变,需审视 AI 应用负载的结构性变化:过去两年行业聚焦于模型训练,该环节依赖 GPU 的大规模并行计算;但 AI 工作负载实则分为三类,除基础基础设施和尖端模型训练外,增长最快的第三类是 AI 推理任务。与从零构建模型的训练不同,推理任务涉及多模型协同、上下文管理及数千个并发请求处理,这些恰恰是 GPU 的短板。正如微软为 OpenAI 建设的'Fairwater'数据中心所示,要运行 295 兆瓦规模的 GPU 集群,必须依赖数千颗 CPU 来处理海量数据流并调度资源,GPU 算力的提升反而加剧了对 CPU 辅助能力的依赖。
Xeon 6+ 的产品定位深刻反映了这一行业现实,其最显著的特征在于集成了 288 个 E 核心(高效能核心)。不同于追求极致单核性能的 P 核心,E 核心在单核性能略逊的同时,凭借更小的芯片面积和更低的功耗,实现了更高的核心密度。午方 AI 注意到,这种设计逻辑表明英特尔的投入重点已从'单核速度'转向'单芯片集成核心数'。当服务器需要同时调度数百个智能代理、处理数千个推理请求并维持数万个并发连接时,288 个 E 核心带来的总吞吐量远比 64 个 P 核心的单核性能更具价值。这种非传统定位标志着'CPU 速度越快越好'的旧观念正在被'高密度核心 + 能效优先'的新范式取代。
然而,这一趋势并非英特尔独有,竞争对手早已布局。AMD 早在 2023 年就推出了基于 Zen 4c 架构的 Bergamo 处理器,AWS 的 Graviton 系列和 Ampere 的 AmpereOne 系列也长期遵循高密度设计原则,其中 AmpereOne Aurora 路线图已规划至 512 核。
这意味着 Xeon 6+ 实际上是在追赶行业既有的技术趋势。
此外,Xeon 6+ 的成功还承载着英特尔 18A 工艺的战略重任,该工艺是英特尔近年来最大的投资之一,直接关系到其代工业务的生死存亡。目前,爱立信正在利用 Xeon 6+ 测试 5G 核心网络,德国电信旗下的 T-Systems 也将其用于构建私有 AI 基础设施,这些传统大型数据中心客户的加入为产品前景增添了积极因素。
尽管前景可期,但'CPU 复兴'仍面临三大不确定性。首先是 GPU 厂商的反应,NVIDIA 已通过 Grace CPU 与 Hopper GPU 的组合尝试填补调度缺口,若其集成方案成为主流,传统 CPU 厂商将面临威胁。其次是云厂商的自研芯片,微软的 Cobalt、谷歌的 Axion 以及阿里巴巴的 Yitian 均遵循高密度设计原则,直接挤压 Xeon 6+ 的市场空间。午方 AI 分析认为,英特尔必须证明在云厂商自研芯片之外,电信运营商、私有云及垂直行业仍存在广阔市场。最后是 18A 工艺本身的竞争力,面对 TSMC N2 工艺在 2026 年下半年量产以及三星 2 纳米工艺的研发进度,Xeon 6+ 能否在性能与稳定性上与之抗衡仍是未知数。
综上所述,2026 年 AI 计算格局的演变并非源于 CPU 性能超越 GPU,而是 AI 应用从'模型训练'向'运行数千个智能代理'的范式转移,使得任务调度与并发处理再次成为关键制约因素。英特尔推出 Xeon 6+ 正是对这一趋势的精准回应,试图通过 18A 工艺和高密度核心设计抢占 AI 推理与私有化部署的新高地。
然而,这场复兴的最终赢家尚未确定,AMD、ARM 阵营、云厂商自研芯片以及 NVIDIA 的跨界竞争,都将共同塑造未来数据中心 CPU 的生态版图。