一直以来,LPDDR(低功耗双倍数据率同步动态随机存储器)主要被用于智能手机、轻薄本等低功耗消费电子设备中。但近年来,随着全球AI推理需求的爆发式增长,LPDDR却正快速向数据中心领域渗透,并逐渐成为端侧、边缘到云端全场景AI推理芯片的共同选择。

无论是国际大厂,还是国内企业,纷纷采用LPDDR作为推理产品的内存方案,背后是成本、功耗、性能的多方面权衡。

01

LPDDR正成为AI推理的“通解”

当前,LPDDR从消费电子领域全面切入AI芯片市场,不仅成为推理GPU的主流内存选项,更延伸至AI专用CPU、桌面AI超级计算机等多个品类。

数据中心

高通AI200/AI250几乎是目前最激进的LPDDR数据中心方案。作为高通首款数据中心级推理系统,Qualcomm AI200加速卡带来专为机架级AI推理打造的解决方案,旨在为大语言模型(LLM)与多模态模型(LMM)推理及其他AI工作负载提供低总体拥有成本与优化性能。每张加速卡支持768GB LPDDR内存,实现更高内存容量与更低成本,为AI推理提供卓越的扩展性与灵活性。该解决方案预计将于2026年正式面向市场发售。将于2027年推出的AI250加速器,在继承AI200核心架构优势的基础上实现了关键技术升级。

英特尔则推出了首款基于Xe3P架构的数据中心GPU,代号为“Crescent Island”(新月岛)。据了解,该产品专为AI推理和Agent工作负载优化,采用了480GB LPDDR5内存,TDP 仅 350W。由于舍弃HBM,它可以在现有风冷数据中心直接部署,无需液冷改造。

国内曦望科技的启望S3则是国产芯片的代表。作为国内首款LPDDR6显存的GPGPU,曦望宣称其推理性价比提升10倍以上,单位token成本降90%。

端侧AI

端侧AI是LPDDR最成熟的领域。

DEEPX是一家专注于边缘计算与端侧AI的韩国半导体企业。就在最近DeepX首席执行官表示,该企业的产品将导入LPDDR-PIM存内计算解决方案。PIM将专用的数据处理器直接集成在DRAM中,可将部分数据计算工作从主机处理器卸载到存储器当中。这可以减少数据的移动,提高AI加速器系统的能效和数据处理效率。三星电子是LPDDR5X-PIM的唯一供应商,因此DeepX将把其80TOPS算力2nm端侧AI芯片DX-M2与三星电子的LPDDR5X-PIM解决方案相匹配。后续的DX-M3也将搭配JEDEC标准化的LPDDR6-PIM。

作为上游供应商,江波龙更是推出两款专为端侧AI推理打造的LPDDR内存方案,即AIDIMM(插槽式)和AILPBGA(焊接式)。AIDIMM采用4颗LPDDR5x同面布局设计,具有最高128GB容量、256bit位宽和307.2GB/s单通道超高带宽。AILPBGA采用自研技术标准与创新架构,单颗原生256bit位宽设计,带宽可达307GB/s,容量覆盖24GB~64GB,全面适配 LPDDR 标准接口;同时采用22×22mm的BGA1764紧凑封装设计。

桌面与AI PC

除了专用的AI推理芯片,LPDDR还正通过"统一内存架构"重新定义AI PC的性能边界。

AMD Strix Halo(Ryzen AI MAX系列)采用256-bit LPDDR5X接口,支持最高128GB LPDDR5X-8000内存,带宽达256GB/s。更激进的苹果M4 Max则采用512-bit LPDDR5X内存总线(32×16-bit控制器),通过Memory-on-Package (MoP)封装实现546GB/s带宽,成为本地运行大语言模型的性能标杆。英伟达也不甘落后,其最近发布的RTX Spark 超级芯片,面向轻薄笔记本和小型台式机,集成Blackwell架构RTX GPU和20核Grace CPU,最高128GB LPDDR5X统一内存,AI算力达1 PFLOP,实现了在低功耗、小体积设备上的高性能AI计算。

此外,英伟达还发布了“全球最强大的桌面AI超级计算机”DGX Station for Windows。DGX Station由GB300 Grace Blackwell Ultra 桌面超级芯片提供支持,通过NVIDIA NVLink-C2C互连将Blackwell Ultra GPU连接到72核Grace CPU。其配备高达748GB的相干内存和高达20 petaflops的FP4性能。而这748GB相干内存包括496 GB LPDDR5X(396 GB/s)的CPU内存和252 GB的HBM3e GPU显存,通过NVLink-C2C互连技术实现CPU与GPU之间的高带宽相干数据交换。

02

为什么是LPDDR?

LPDDR的全称是Low Power Double Data Rate SDRAM(低功耗双倍数据率同步动态随机存取存储器)。顾名思义,它的一切设计都围绕着“省电”展开。它通常以芯片的形式,直接焊接在手机或超薄本的主板上,与处理器紧挨着,几乎不可更换。那么,为什么如今这些厂商不约而同的向LPDDR内存倒戈?

首先,LPDDR的成本更低,供应更充足。HBM是由多个DRAM芯片垂直堆叠而成的3D结构,每一层都要通过TSV硅通孔和微凸点互连。随着堆叠层数增多,良率呈指数级下降。因3D堆叠工艺复杂、良率有限,HBM长期处于供应紧张状态。相比HBM,LPDDR依托成熟的平面DRAM工艺和大规模消费电子产能,单位容量成本远低于HBM,能够显著降低AI推理服务器的硬件投入与总拥有成本,尤其适合大规模部署的推理场景。

其次,LPDDR的容量更大,单张卡可以加载更大的模型,上下文也可以更长。高通 AI200 的 768GB LPDDR 是行业最大容量。作为对比,NVIDIA GB300 单 GPU 仅 288GB HBM3e,AMD MI450X 为 432GB HBM4。由于HBM主要通过硅中介层与处理器进行2.5D封装,必须紧邻核心排布,这不仅限制了单系统的总容量上限,其PHY的固定宽度与接口位置还限制了布局。反观LPDDR5X,控制器IP生态成熟、获取门槛低,PCB/基板布线及信号训练(Training)流程高度标准化。系统扩展也极为灵活,需要带宽可通过多通道并行实现,需要容量也可以堆,不过是多增加一些引脚数量。

此外,LPDDR的功耗更低。以英特尔的Crescent Island为例,由于采用LPDDR而非HBM的选择,功耗降至350W,意味着它可以在现有风冷数据中心中直接运行,不需要液冷改造。这也省去了数据中心的液冷改造投入,降低投资成本和建设周期。

最后,推理对于存储的大带宽的要求要低于训练。在训练场景中,处理大量数据的反向传播需要极高的内存带宽,使得HBM不可替代。但在推理场景中,模型参数是固定的,重点在于大容量存储和高效检索;LPDDR的容量和成本优势远远超过了带宽方面的缺点。今年的GTC大会上,黄仁勋表示,AI推理市场拐点已经到来,AI从训练阶段全面进入推理与执行阶段,推理算力需求呈指数级爆发。相较于传统训练芯片,推理芯片更强调功耗控制、成本效率以及部署灵活性,LPDDR显然更具优势。

芯片巨头同时转向LPDDR并非巧合,而是整个行业的调整。一些组织指出,到2030年,推理工作负载的数量将是训练工作负载的100倍。数据中心AI芯片采用LPDDR是一个明确的推理导向设计选择。在HBM供应紧张、价格高昂的背景下,高通、Intel等厂商通过LPDDR实现了"单卡大容量、低TCO、风冷部署"的差异化路线,尤其适用于LLM推理、视频分析、推荐系统等带宽需求相对可控、容量需求极高的场景。当然,LPDDR解决方案也并非没有成本。与HBM相比,它存在较低的内存带宽、因接口更窄导致的延迟较高,以及在24小时高温服务器环境中尚未被证明的可靠性。

03

LPDDR需求暴涨

厂商集体转向的直接后果,是LPDDR需求的几何级增长。

以高通的AI200为例,单个机架可能包含数十张加速卡,每张拥有768GB内存,总内存容量达数十TB。这相当于数十万甚至数百万智能手机的内存使用量。而这只是一家公司出品的一款产品。当高通、英特尔、英伟达以及其他潜在竞争者(如AMD和博通)在2026-2027年大规模生产LPDDR解决方案时,LPDDR的需求将呈指数增长。

还有分析师指出,英伟达Vera Rubin AI服务器所需的LPDDR使用量将从2026年的31.44亿GB攀升至2027年的60.41亿GB,占2027年全球LPDDR总供应能力的36%。这一数字将首次超越苹果29.66亿GB与三星27.24亿GB的用量总和。

Vera Rubin是英伟达在GTC 2026上宣布全面投产的最新AI平台,由Vera CPU和Rubin GPU构成。其中,Vera CPU搭载88个定制ARMv9.2“Olympus”核心,系统支持高达1.5TB(约1536GB)的LPDDR5X内存,采用新一代SOCAMM2封装形态。相比之下,一部旗舰智能手机通常只配备12-16GB LPDDR5X内存——这意味着单颗Vera CPU的LPDDR配备量约为一部手机的90倍。

AMD同样在推升LPDDR需求。其将于2027年推出的第六代EPYC服务器处理器“Verano”将首次支持SOCAMM2形态的LPDDR5X内存。

LPDDR的供应逻辑与HBM完全不同。HBM由SK海力士、三星、美光三巨头垄断,产能高度受限;而LPDDR拥有更庞大的消费电子产能基底和更成熟的供应链。当AI巨头集体转向,LPDDR的产能将成为AI基础设施扩张的关键变量。

04

LPDDR6:从“够用”到“好用”

JEDEC固态技术协会于2026年4月正式预览LPDDR6路线图。

此次路线图,其中最令人瞩目的是:LPDDR6单颗内存芯片的容量有望达到512GB。这一容量规格直接大幅超越当前主流服务器DDR5。目前主流服务器DDR5单根容量普遍停留在64GB—128GB,单颗Die容量差距更为悬殊。之所以能实现如此夸张的容量突破,主要是因为JEDEC新增了更窄的x6子通道模式,让单个封装能容纳更多内存die。再配合更先进的制程工艺带来单颗die的密度提升,最终使单颗芯片就能承载以往整根内存条才能达到的容量。

LPDDR6的性能规格较上一代产品实现显著跃升。这一代产品的带宽可达10.6Gbps至14.4Gbps,而上一代LPDDR5X的带宽范围为8.5Gbps至最高10.7Gbps,性能提升约1.5倍。SK海力士已成功开发出采用1cnm工艺的16Gb LPDDR6 DRAM,并完成了全球首个相关认证。这款全新的16Gb LPDDR6 DRAM在性能上实现了显著提升。其运行速度达到10.7Gbps,数据处理速度较上一代LPDDR5X产品提高了33%。

同时,基于LPDDR6的SOCAMM2紧凑型模块标准已在同步开发中,用以替代传统又厚又大的DDR5条,为AI服务器提供更高集成度的低功耗内存底座。对普通游戏和创作玩家而言,LPDDR6的进阶不在一蹴而就,但未来三年内,高端游戏本、平板或AIPC都有望获得超大内存。更关键的是,在保持轻薄续航的前提下,端侧运行数百亿参数的大模型甚至大型仿真渲染将成为常态。

采用LPDDR,是一个明确的推理导向设计选择。它标志着AI算力竞争从"训练时代的HBM带宽竞赛"转向"推理时代的容量与TCO竞赛"。随着LPDDR6的512GB单颗容量、14.4Gbps速率、SOCAMM2模块化封装和PIM存内计算的成熟,AI服务器将轻松构建TB级内存池。模型权重与KV Cache不再需要在内存与SSD之间"痛苦搬家",端侧运行数百亿参数大模型、车载实时多模态推理、桌面AI Agent常驻后台——都将成为常态。