登录
注册
据 Woofun AI 消息,人工智能推理领域正面临内存与存储技术的严峻瓶颈,HBM 与 DRAM 的供需矛盾预计将持续至少五年。随着 GPU 架构对 HBM 依赖呈指数级增长,市场核心焦点在于产能扩张能否匹配需求,以及长鑫科技扩产的实际影响力。生产周期漫长导致内存市场周期性特征显著,唯有通过定制化设计、结构性需求爆发或技术快速迭代才能打破传统困境。
HBM 技术虽在封装与基片设计上具备定制化元素,但其 DRAM 层仍遵循 JEDEC 标准,允许一定程度的产能重新分配,例如三星在未能通过英伟达认证后,仍将 HBM3E 产品供应给谷歌和 AMD。
然而,HBM4 时代基片上将增加自定义逻辑电路与缓存结构,定制化程度将进一步提升。推动这一趋势的核心动力源于市场对英伟达芯片性能提升的迫切需求,因为芯片性能直接取决于 HBM 的容量与带宽。每颗 GPU 所使用的 HBM 容量每年以超过 40% 的速度增长,这一增速远超 DRAM 供应链中晶圆产量的 14% 增速及密度提升的 9% 增速。由于注意力机制对缓存带宽的高要求,HBM 在当前市场占据独特地位,至少在未来五年内,SRAM、HBF、CXL、PIM 等替代技术均无法在主流市场构成有效竞争。
HBM 的升级周期为两年,每次升级均使速度与容量翻倍,导致旧版本产品迅速丧失经济竞争力。这使得制造商间的竞争焦点从单纯产量转向产品稳定性与性能,即产品在英伟达平台上的应用占比,从而规避了传统意义上的"囚徒困境"。内存市场周期性波动的根源在于长达三年的生产线建设周期与不稳定市场需求之间的矛盾,但人工智能的快速发展在一定程度上缓解了这种周期性。
值得注意的是,DRAM 每块晶圆上的比特密度增速已从 2000 年的 45% 降至目前的 9%,这意味着产能扩张更多依赖新建生产线而非密度提升。相对于普通 DRAM,HBM 生产难度显著增加,生产 HBM3e 需消耗约 3 倍于 DRAM 的晶圆数量,而 HBM4 则需约 4 倍,导致每块晶圆可生产的比特数量呈现通缩趋势。
HBM 的持续演进取决于 Transformer 架构及相关缓存机制的长期有效性,鉴于注意力机制在动态路由中的基础角色,HBM 未来仍将在人工智能推理系统中占据核心地位。
与此同时,DRAM 正经历结构性变化,虽未经过定制化设计,但受益于 CPU 驱动的结构性需求高速增长。目前 CPU 与 GPU 的比例正从 1:4 向 1:2 甚至 1:1 转变,在需 CPU 大量处理的场景中,CPU 处理延迟已成为严重瓶颈,迫使 DRAM 产能同步扩张。人工智能应用普及导致代码量与 API 调用次数激增,CPU 使用时间呈指数级增长,用于数据库更浪费了内存与算力资源。因此,AMD、ARM、英伟达及伯恩斯坦研究所均上调了对 CPU 总处理能力的预测,预计到 2030 年将达到 600 亿美元至 2230 亿美元,2031 年甚至可能突破 4000 亿美元大关。
由于代理任务需保留消息历史记录与上下文信息,这些数据通常存储于 DRAM 中,导致上下文窗口从 32KB 扩大至 1MB,单次会话所需内存资源持续增加。Woofun AI 整理数据显示,若假设 2030 年 CPU 总处理能力为 3000 亿美元且每核心内存使用量为 16GB,新增 DRAM 需求量将达 96EB,远超当前全球 47EB 至 60EB 的生产能力。
这种巨大的供需差距必将引发 DRAM 价格波动。服务器与边缘计算领域对 AI 需求的增长加速了 DRAM 技术迭代,如苹果对 LPDDR 内存的需求便体现了这一趋势,DDR6/LPDDR6 因性能优势被迅速采纳。
此外,HBM 生产消耗了大量原本用于普通 DRAM 的晶圆,致使非 HBM 类 DRAM 比特产量年增率仅约 20%。
长鑫科技虽将产能扩大至每月 50 万片晶圆,但其 DRAM 比特密度仅为前三大生产商平均水平的 50%,对行业整体影响有限,估计其对 DRAM 比特产量年均增长率的贡献仅为 1.5%,使行业增速从 12.7% 提升至 14.2%。高速 DDR6 技术发展受光刻工艺限制,进一步制约了长鑫科技的潜力。到 2030 年,DRAM 供需缺口将继续扩大,需求年均增长率约 50%,而供给仅约 20%。由于边缘计算、消费电子及低价值应用等领域存在大量被压抑的需求,即使供给暂时跟上,价格亦难暴跌。HBM 与 DRAM 价格存在关联,若 DRAM 利润率下降将波及 HBM 盈利能力,进而推动产能调整以维持价格稳定。NAND SSD 同样受益于 AI 技术,如减轻 KV 缓存负担、生成视频内容及优化存储效率,尽管增长动力较弱,但成本效益极高,预计 2027 年 NAND 单价仅为 0.8 美元/GB,而 DRAM 则为这一价格的两倍左右。主要厂商严格控制生产节奏导致 NAND 市场同样面临严重短缺,此次 NAND 快速增长属于超级周期,预计将把市场低迷期推迟至 2030 年之后。这是继 HBM 产能瓶颈之后,存储行业面临的又一轮长期结构性挑战。