近日,美光科技股份有限公司宣布,推出数据中心 SSD 产品美光 9550 NVMe SSD和第九代NAND 闪存技术产品。在7月31日举行的媒体交流会上,美光相关产品负责人对两款产品的技术参数进行了介绍,并称,9550 SSD基于NVIDIA H100 GPU平台,针对AI工作负载进行了优化,特别考虑了采用大型加速器内存(BaM)进行图神经网络(GNN)训练。
大型语言模型(LLM)需要高顺序读取速率,而图形神经网络(GNN)则需要高随机读取性能。记者在媒体交流会上了解到,美光 9550 NVMe SSD顺序读取速率达14.0 GB/s, 顺序写入速率达10.0 GB/s ,相较业界同类 SSD实现67%的性能提升。相较市场上的同类 NAND 解决方案,美光第九代 NAND 闪存技术产品的写入带宽和读取带宽分别高出 99% 和 88%。
美光展示了9550 SSD应对不同AI工作负载方面的数据表现:当使用 BaM 进行 GNN 训练时,SSD 平均功耗降低43%,整体系统能耗减少29%;应用于NVIDIA Magnum IO GPUDirect Storage时,每传输 1TB 数据,SSD 能耗降低81%;应用于MLPerf训练时, SSD 能耗降低35%,系统能耗降低13%;使用 Microsoft DeepSpeed 对 Llama LLM 训练进行微调时,SSD 能耗降低21%。
理论上,NAND芯片的堆叠层数越多,其输入输出效率越高、读写速度越快、功耗越低,在相同容量情况下物理空间占用越小。在美光公司媒体交流会上,美光存储事业部 NAND 产品生命周期管理及应用工程总监Daniel Loughmiller回应了记者对堆叠层数的关注:“美光的第七代NAND有176层,第八代NAND增加到了232层,而此次发布的第九代NAND达到了276层。但随着层数的增加,层数对NAND性能的重要性会降低。”他表示,美光正在研究多项前沿技术,并预计NAND层数将继续增加,但如何降低能耗、提高性能和芯片密度,比单纯的层数要求更为重要。