人工智能的爆发式增长正在倒逼存储技术加速迭代,而三星近日披露的NAND闪存路线图,正是这一趋势下的最新科技突破。在2026年IEEE/JSAP VLSI技术与电路研讨会上,三星官方公开了从2029年420层到2030年560层以上,再到下一个十年初由900至1000层的完整演进路径。这一规划不仅意味着单颗SSD容量将从如今的8TB跃升至32TB,更暗示着AI技术产业链中数据存储瓶颈即将被打破。
从420层到1000层:三星的NAND堆叠时间表
根据三星在研讨会上展示的幻灯片,其3D NAND闪存路线图分为三个阶段。第一阶段是2029年实现420层解决方案,这将是当前行业主流238层至276层产品的直接跃升。第二阶段瞄准2030年,目标推进至560层以上,届时单芯片密度将达到15Tb级别。真正的重头戏在下一个十年初——三星计划通过CMB(Cell Multi-Bonding,单元多重键合)技术,将两组450层单元封装在同一芯片内,形成900至1000层结构,让QLC M.2 SSD的最大容量从当前最高8TB直接翻四倍至32TB。
值得注意的是,三星并未将420层视为“过渡节点”。该公司在演讲中强调,每一代堆叠都需要在工艺稳定性和良率之间寻找平衡。大模型训练对存储带宽和容量的渴求,正推动三星加速这一时间表。事实上,此前已有消息称三星完成了900层原型开发,但正式量产仍需解决多项工艺难题。

晶圆翘曲与对准误差:堆叠攀登的两座大山
当层数超过500层时,晶圆翘曲(Wafer Warpage)和层间对准误差(Layer misalignment)成为制约量产的核心障碍。三星在路线图中详细披露了两大应对方案。首先针对翘曲,三星计划引入“Upper Chuck Design”方案——这是一种上下双吸盘固定结构,能够在高温沉积和刻蚀过程中均匀分散应力,将晶圆曲率半径控制在可接受范围内。其次,对准误差问题将通过“Overlay Correction(叠对校正)”技术解决,该技术利用实时测量反馈,调整每层光刻的偏移量,确保上百层电路图案的垂直方向精度。
这些工艺细节背后反映出最新科技在半导体制造中的深度融合。三星的研发团队表示,1000层NAND并非简单的“层数叠加”,而是涉及材料、设备、算法等多维度的系统性工程。例如,人工智能辅助的光刻对准系统已经开始在实验室中测试,通过机器学习模型预测热效应引起的形变,从而提前补偿偏差。
CMB技术:单芯片内封装的“基因重组”
三星路线图中最引人注目的技术当属CMB(单元多重键合)。传统3D NAND是在单一场区中垂直堆叠存储单元,随着层数增加,孔洞刻蚀深度和宽高比会指数级增长,最终达到物理极限。CMB方案则将这一难题“拆分”——先分别制造两组450层单元,再通过混合键合(Hybrid Bonding)技术将二者面对面连接,形成逻辑上的一颗芯片。
这种“拼合”方式不仅降低了单次刻蚀的难度,还允许两组单元采用不同的工艺节点。例如,下层可以采用成熟工艺保证良率,上层则用先进工艺追求高密度。三星预计CMB技术将使每平方毫米的存储密度提升40%以上。AI技术的模型参数正以每年10倍的速度膨胀,CMB带来的32TB单盘容量意味着企业无需再为数据湖搭建冗长的硬盘阵列,一台服务器即可承载全量训练数据。
高阶QLC与M.2形态的极限压缩
三星路线图中的容量提升主要依赖QLC(四层单元)技术。相比于当前主流的TLC(三层单元),QLC每单元可存储4比特数据,但写入速度和寿命相对较低。针对这一问题,三星计划在900层以上的产品中引入新型PUC(Peripheral Under Cell)架构——将控制电路放置在存储阵列下方,从而释放芯片边缘空间用于更多存储单元。同时,配合增强型ECC纠错算法和ZNS(分区命名空间)技术,QLC在大规模顺序读写场景下的表现完全可以匹敌TLC。
在物理形态上,32TB的M.2 SSD将需要采用更高效的散热设计和更高的PCB层数。三星透露正在开发一种“双面堆叠”M.2模块,厚度控制在3.8mm以内,兼容现有PCIe 5.0接口。这种高密度封装的背后,企业数字化转型正在催生海量冷存储需求,而32TB M.2 SSD恰好填补了机械硬盘与普通固态硬盘之间的性能空白。
存储格局重塑:三星的野心与竞品压迫
目前全球NAND闪存市场由三星、SK海力士、美光、铠侠和西部数据主导。三星在238层领域已实现量产,但SK海力士的321层产品预计2025年出货,美光也在2024年展示了276层方案。人工智能的训练集群往往需要PB级存储,谁能率先推出高密度、低功耗的SSD,谁就能占据下一代AI服务器的采购清单。
三星此次公布的时间表显得极为激进——从420层到560层仅间隔一年,而从560层到1000层却跨越了五年。这种先稳后快的节奏,暗示三星可能在560层阶段实现某种“工艺拐点”,之后借助CMB技术快速翻倍。值得注意的是,最新科技的迭代不是线性过程,一旦CMB方案验证成功,1000层产品的量产时间可能比规划更早。
AI场景驱动的存储即算力
随着大语言模型参数量突破万亿,分布式训练中数据传输与存储IO已成为新的瓶颈。传统做法是将数据集切分存储在多个硬盘上,通过高速网络实时调用。AI技术的发展要求存储设备不仅能装得下,更要读得快。三星的1000层QLC SSD虽然单盘顺序读取可达7GB/s,但在随机4K读写方面仍未公开数据。不过,人工智能领域的工程师们已经在尝试将部分模型权重预烧录到高密度闪存中,利用其近存计算的潜力。
事实上,三星在VLSI研讨会上还展示了一项“存储内计算”原型:在NAND芯片中嵌入轻量级计算单元,直接执行矩阵向量乘法等简单操作。这一方向如果成熟,AI工具导航上的推理工具将可以直接调用SSD内部的算力,大幅降低模型部署的功耗和延迟。
量产挑战与行业协作
即使技术路线图清晰,从实验室到工厂的跨越仍面临多重挑战。晶圆翘曲在600层以上时可能突破设备极限,三星的Upper Chuck Design需要搭配新一代离子注入和退火设备,投资额预计超过20亿美元。此外,CMB技术中的混合键合工艺对颗粒污染极其敏感,微米级颗粒就可能导致整片晶圆报废。三星正在与设备供应商合作开发“In-Situ Particle Monitoring”系统,利用激光扫描实时检测键合界面的缺陷。
行业协作方面,三星已经与多家存储控制器厂商(如群联、慧荣)展开联合验证,确保32TB SSD能被主流NVMe控制器正确识别和访问。对于普通消费者而言,2028年左右将能看到16TB级别的消费级M.2 SSD上市,而企业级32TB产品可能需要等到2030年后。
总结:存储容量竞赛拉开下半场
三星的NAND路线图不仅是一张技术时间表,更是存储行业进入“千层时代”的宣言。在人工智能深度渗透各行各业的今天,数据生产速度和体量已远超摩尔定律的覆盖范围。三星通过CMB技术绕开传统刻蚀的物理极限,为SSD容量提升提供了全新的数学解。未来五年,我们有望见证:一块指甲盖大小的芯片内堆叠超过1000层,存储容量的跃进将直接改变AI模型的训练范式——不再受制于数据分片与加载延迟,AI图片生成等领域的创作者也能更自由地调用超高分辨率素材。
当然,任何革命性技术都需要时间验证。三星能否在2030年前攻克翘曲和对准难题?CMB良率能否达到90%以上?这些问题将决定这份路线图是宣言还是墓志铭。但至少现在,我们看到了存储行业最清晰的未来——千层NAND,近在咫尺。