LPDDR逆袭：AI推理芯片为何集体“换芯”？,ai芯片选型

一直以来，LPDDR（低功耗双倍数据率同步动态随机存储器）主要被用于智能手机、轻薄本等低功耗消费电子设备中。但近年来，随着全球AI推理需求的爆发式增长，LPDDR却正快速向数据中心领域渗透，并逐渐成为端侧、边缘到云端全场景AI推理芯片的共同选择。

无论是国际大厂，还是国内企业，纷纷采用LPDDR作为推理产品的内存方案，背后是成本、功耗、性能的多方面权衡。

LPDDR正成为AI推理的“通解”

当前，LPDDR从消费电子领域全面切入AI芯片市场，不仅成为推理GPU的主流内存选项，更延伸至AI专用CPU、桌面AI超级计算机等多个品类。

数据中心

高通AI200/AI250几乎是目前最激进的LPDDR数据中心方案。作为高通首款数据中心级推理系统，Qualcomm AI200加速卡带来专为机架级AI推理打造的解决方案，旨在为大语言模型（LLM）与多模态模型（LMM）推理及其他AI工作负载提供低总体拥有成本与优化性能。每张加速卡支持768GB LPDDR内存，实现更高内存容量与更低成本，为AI推理提供卓越的扩展性与灵活性。该解决方案预计将于2026年正式面向市场发售。将于2027年推出的AI250加速器，在继承AI200核心架构优势的基础上实现了关键技术升级。

英特尔则推出了首款基于Xe3P架构的数据中心GPU，代号为“Crescent Island”（新月岛）。据了解，该产品专为AI推理和Agent工作负载优化，采用了480GB LPDDR5内存，TDP 仅 350W。由于舍弃HBM，它可以在现有风冷数据中心直接部署，无需液冷改造。

国内曦望科技的启望S3则是国产芯片的代表。作为国内首款LPDDR6显存的GPGPU，曦望宣称其推理性价比提升10倍以上，单位token成本降90%。

端侧AI

端侧AI是LPDDR最成熟的领域。

DEEPX是一家专注于边缘计算与端侧AI的韩国半导体企业。就在最近DeepX首席执行官表示，该企业的产品将导入LPDDR-PIM存内计算解决方案。PIM将专用的数据处理器直接集成在DRAM中，可将部分数据计算工作从主机处理器卸载到存储器当中。这可以减少数据的移动，提高AI加速器系统的能效和数据处理效率。三星电子是LPDDR5X-PIM的唯一供应商，因此DeepX将把其80TOPS算力2nm端侧AI芯片DX-M2与三星电子的LPDDR5X-PIM解决方案相匹配。后续的DX-M3也将搭配JEDEC标准化的LPDDR6-PIM。

作为上游供应商，江波龙更是推出两款专为端侧AI推理打造的LPDDR内存方案，即AIDIMM（插槽式）和AILPBGA（焊接式）。AIDIMM采用4颗LPDDR5x同面布局设计，具有最高128GB容量、256bit位宽和307.2GB/s单通道超高带宽。AILPBGA采用自研技术标准与创新架构，单颗原生256bit位宽设计，带宽可达307GB/s，容量覆盖24GB~64GB，全面适配 LPDDR 标准接口；同时采用22×22mm的BGA1764紧凑封装设计。

桌面与AI PC

除了专用的AI推理芯片，LPDDR还正通过"统一内存架构"重新定义AI PC的性能边界。

AMD Strix Halo（Ryzen AI MAX系列）采用256-bit LPDDR5X接口，支持最高128GB LPDDR5X-8000内存，带宽达256GB/s。更激进的苹果M4 Max则采用512-bit LPDDR5X内存总线（32×16-bit控制器），通过Memory-on-Package (MoP)封装实现546GB/s带宽，成为本地运行大语言模型的性能标杆。英伟达也不甘落后，其最近发布的RTX Spark 超级芯片，面向轻薄笔记本和小型台式机，集成Blackwell架构RTX GPU和20核Grace CPU，最高128GB LPDDR5X统一内存，AI算力达1 PFLOP，实现了在低功耗、小体积设备上的高性能AI计算。

此外，英伟达还发布了“全球最强大的桌面AI超级计算机”DGX Station for Windows。DGX Station由GB300 Grace Blackwell Ultra 桌面超级芯片提供支持，通过NVIDIA NVLink-C2C互连将Blackwell Ultra GPU连接到72核Grace CPU。其配备高达748GB的相干内存和高达20 petaflops的FP4性能。而这748GB相干内存包括496 GB LPDDR5X（396 GB/s）的CPU内存和252 GB的HBM3e GPU显存，通过NVLink-C2C互连技术实现CPU与GPU之间的高带宽相干数据交换。

为什么是LPDDR？

LPDDR的全称是Low Power Double Data Rate SDRAM（低功耗双倍数据率同步动态随机存取存储器）。顾名思义，它的一切设计都围绕着“省电”展开。它通常以芯片的形式，直接焊接在手机或超薄本的主板上，与处理器紧挨着，几乎不可更换。那么，为什么如今这些厂商不约而同的向LPDDR内存倒戈？

首先，LPDDR的成本更低，供应更充足。HBM是由多个DRAM芯片垂直堆叠而成的3D结构，每一层都要通过TSV硅通孔和微凸点互连。随着堆叠层数增多，良率呈指数级下降。因3D堆叠工艺复杂、良率有限，HBM长期处于供应紧张状态。相比HBM，LPDDR依托成熟的平面DRAM工艺和大规模消费电子产能，单位容量成本远低于HBM，能够显著降低AI推理服务器的硬件投入与总拥有成本，尤其适合大规模部署的推理场景。

其次，LPDDR的容量更大，单张卡可以加载更大的模型，上下文也可以更长。高通 AI200 的 768GB LPDDR 是行业最大容量。作为对比，NVIDIA GB300 单 GPU 仅 288GB HBM3e，AMD MI450X 为 432GB HBM4。由于HBM主要通过硅中介层与处理器进行2.5D封装，必须紧邻核心排布，这不仅限制了单系统的总容量上限，其PHY的固定宽度与接口位置还限制了布局。反观LPDDR5X，控制器IP生态成熟、获取门槛低，PCB/基板布线及信号训练（Training）流程高度标准化。系统扩展也极为灵活，需要带宽可通过多通道并行实现，需要容量也可以堆，不过是多增加一些引脚数量。

此外，LPDDR的功耗更低。以英特尔的Crescent Island为例，由于采用LPDDR而非HBM的选择，功耗降至350W，意味着它可以在现有风冷数据中心中直接运行，不需要液冷改造。这也省去了数据中心的液冷改造投入，降低投资成本和建设周期。

最后，推理对于存储的大带宽的要求要低于训练。在训练场景中，处理大量数据的反向传播需要极高的内存带宽，使得HBM不可替代。但在推理场景中，模型参数是固定的，重点在于大容量存储和高效检索；LPDDR的容量和成本优势远远超过了带宽方面的缺点。今年的GTC大会上，黄仁勋表示，AI推理市场拐点已经到来，AI从训练阶段全面进入推理与执行阶段，推理算力需求呈指数级爆发。相较于传统训练芯片，推理芯片更强调功耗控制、成本效率以及部署灵活性，LPDDR显然更具优势。

芯片巨头同时转向LPDDR并非巧合，而是整个行业的调整。一些组织指出，到2030年，推理工作负载的数量将是训练工作负载的100倍。数据中心AI芯片采用LPDDR是一个明确的推理导向设计选择。在HBM供应紧张、价格高昂的背景下，高通、Intel等厂商通过LPDDR实现了"单卡大容量、低TCO、风冷部署"的差异化路线，尤其适用于LLM推理、视频分析、推荐系统等带宽需求相对可控、容量需求极高的场景。当然，LPDDR解决方案也并非没有成本。与HBM相比，它存在较低的内存带宽、因接口更窄导致的延迟较高，以及在24小时高温服务器环境中尚未被证明的可靠性。

LPDDR需求暴涨

厂商集体转向的直接后果，是LPDDR需求的几何级增长。

以高通的AI200为例，单个机架可能包含数十张加速卡，每张拥有768GB内存，总内存容量达数十TB。这相当于数十万甚至数百万智能手机的内存使用量。而这只是一家公司出品的一款产品。当高通、英特尔、英伟达以及其他潜在竞争者（如AMD和博通）在2026-2027年大规模生产LPDDR解决方案时，LPDDR的需求将呈指数增长。

还有分析师指出，英伟达Vera Rubin AI服务器所需的LPDDR使用量将从2026年的31.44亿GB攀升至2027年的60.41亿GB，占2027年全球LPDDR总供应能力的36%。这一数字将首次超越苹果29.66亿GB与三星27.24亿GB的用量总和。

Vera Rubin是英伟达在GTC 2026上宣布全面投产的最新AI平台，由Vera CPU和Rubin GPU构成。其中，Vera CPU搭载88个定制ARMv9.2“Olympus”核心，系统支持高达1.5TB（约1536GB）的LPDDR5X内存，采用新一代SOCAMM2封装形态。相比之下，一部旗舰智能手机通常只配备12-16GB LPDDR5X内存——这意味着单颗Vera CPU的LPDDR配备量约为一部手机的90倍。

AMD同样在推升LPDDR需求。其将于2027年推出的第六代EPYC服务器处理器“Verano”将首次支持SOCAMM2形态的LPDDR5X内存。

LPDDR的供应逻辑与HBM完全不同。HBM由SK海力士、三星、美光三巨头垄断，产能高度受限；而LPDDR拥有更庞大的消费电子产能基底和更成熟的供应链。当AI巨头集体转向，LPDDR的产能将成为AI基础设施扩张的关键变量。

LPDDR6：从“够用”到“好用”

JEDEC固态技术协会于2026年4月正式预览LPDDR6路线图。

此次路线图，其中最令人瞩目的是：LPDDR6单颗内存芯片的容量有望达到512GB。这一容量规格直接大幅超越当前主流服务器DDR5。目前主流服务器DDR5单根容量普遍停留在64GB—128GB，单颗Die容量差距更为悬殊。之所以能实现如此夸张的容量突破，主要是因为JEDEC新增了更窄的x6子通道模式，让单个封装能容纳更多内存die。再配合更先进的制程工艺带来单颗die的密度提升，最终使单颗芯片就能承载以往整根内存条才能达到的容量。

LPDDR6的性能规格较上一代产品实现显著跃升。这一代产品的带宽可达10.6Gbps至14.4Gbps，而上一代LPDDR5X的带宽范围为8.5Gbps至最高10.7Gbps，性能提升约1.5倍。SK海力士已成功开发出采用1cnm工艺的16Gb LPDDR6 DRAM，并完成了全球首个相关认证。这款全新的16Gb LPDDR6 DRAM在性能上实现了显著提升。其运行速度达到10.7Gbps，数据处理速度较上一代LPDDR5X产品提高了33%。

同时，基于LPDDR6的SOCAMM2紧凑型模块标准已在同步开发中，用以替代传统又厚又大的DDR5条，为AI服务器提供更高集成度的低功耗内存底座。对普通游戏和创作玩家而言，LPDDR6的进阶不在一蹴而就，但未来三年内，高端游戏本、平板或AIPC都有望获得超大内存。更关键的是，在保持轻薄续航的前提下，端侧运行数百亿参数的大模型甚至大型仿真渲染将成为常态。

采用LPDDR，是一个明确的推理导向设计选择。它标志着AI算力竞争从"训练时代的HBM带宽竞赛"转向"推理时代的容量与TCO竞赛"。随着LPDDR6的512GB单颗容量、14.4Gbps速率、SOCAMM2模块化封装和PIM存内计算的成熟，AI服务器将轻松构建TB级内存池。模型权重与KV Cache不再需要在内存与SSD之间"痛苦搬家"，端侧运行数百亿参数大模型、车载实时多模态推理、桌面AI Agent常驻后台——都将成为常态。