0
| 本文作者: 刘伊伦 | 2026-04-10 18:27 |

“全球半导体存储器的市场规模预估将突破6000亿美元。”
MemoryS 2026上,深圳市闪存市场资讯有限公司总经理邰炜抛出这一数字,彰显着存储行业的底层逻辑已悄然改变:周期性行情退场,AI主导的新范式降临。
引爆这场变革的,是AI推理对存储的指数级需求:单请求情况下,若上下文从4K Token扩展至128K Token,KV缓存会膨胀32倍,若是100个并发请求,缓存需求则达TB级。
面对这种需求量,HBM已无力承载,这就决定了KV缓存开始大规模向企业级SSD迁移。
叠加NL HDD产能缺口带来的替代效应,多重变量共振,企业级SSD正在成为2026年NAND闪存最大的应用市场。
“企业级SSD不再只是容量载体,而成了整个算力架构里突破性能瓶颈的关键。”邰炜说到。
变局之下,AI对企业级SSD的标准无限拔高,高可靠性、低时延、高寿命既是定价标尺,也是厂商厮杀的核心战场。
谁能破解“AI时代数据搬运的功耗与延迟”,谁就将定义下一个十年。
超级周期已启幕,存储厂商各有出招。
不做GPU的「配角」,SSD开始介入AI计算
当AI推理规模化爆发,存储与计算的关系正在被重新定义:SSD不再只是数据的“仓库”,而是影响Token生成效率的关键变量。
这种定位的跃迁,正在倒逼存储厂商重新思考自身的技术纵深。
以大普微为例,为了实现更快的Token生成与响应,其通过Fast SSD与TLC SSD的产品组合,打造高IOPS和低时延的数据供给能力,从而节省算力和成本。
更深一层的变化在于,存储开始介入计算的数据流调度。
大普微通过透明压缩技术实现将KV Cache的数据无损压缩21%以上,从而等效提升27%的带宽,带来直接的性能与用户容量收益。
与此同时,FDP(灵活数据放置)技术的引入,让SSD可以根据数据生命周期进行分组管理,从而降低写放大与延迟波动,为GPU提供可预期的数据供给节奏。
这些技术点的串联,勾勒出一个清晰的演进方向:SSD正在从“存储设备”进化为“AI数据调度节点”,它不仅要存得快、存得多,还要存得“聪明”,能在正确的时间把正确的数据送到正确的位置。
更值得关注的是其产品节奏与AI算力迭代的同频。
“目前,企业级SSD的市场大概能按照容量进行划分,4TB-32TB是TLC SSD的规模甜点,30TB以上则是QLC SSD的主力区间,大普微今年推出245TB的产品,明年就会设计为512TB。”大普微董事长杨亚飞对雷峰网(公众号:雷峰网)表示。
这种“容量翻倍”的产品策略,与AI模型参数规模的增长曲线形成了共振,为下一阶段产品的放量埋下基础。

SSD的竞争核心是让GPU「不空转」
当SSD开始承担KV Cache卸载、AI数据湖、推理缓存等任务,它既要提供接近内存级的延迟稳定性,又要具备远高于内存的容量密度和成本优势。
在这种变化下,SSD的评价体系也随之重构。
过去行业更强调带宽、IOPS与寿命,在AI场景中,长尾延迟控制、QoS一致性以及每瓦性能开始变得同样关键。
对大型算力集群来说,一块SSD的价值不只是单盘性能有多高,而在于它能否在复杂负载下保持稳定响应,避免GPU因等待I/O而“空转”。
也正是在这样的背景下,企业级存储厂商开始向系统能力延伸。
以忆恒创源为例,其核心策略并不是简单堆叠硬件参数,而是通过固件算法和系统级调度,把不同来源的控制器与NAND颗粒调校成更适合AI负载的产品形态。
在大规模线上部署中,依托国内大规模、高度复杂的AI与互联网生态,在极端且高频的业务压力下,其SSD的平均无故障时间(MTBF)已经达到约1500万小时,产品的稳定性有可观的场景及数据背书。
在AI负载环境下,通过固件调度优化和延迟控制,其随机读延迟可以压缩至50微秒级,从而减少推理场景中GPU等待I/O的时间。
并且,通过对固件和硬件架构的协同优化,高密度QLC在AI数据湖和推理场景中既能提供更大的容量密度,也能维持稳定的性能表现。
对于需要存储海量训练数据或推理缓存的集群而言,这类产品正在成为实现“全闪数据中心”的关键一步。

AI重构存储路径:企业级SSD从「容量介质」转向「算力系统变量」
在这一轮由 AI 推动的存储重构中,一个更清晰的共识正在形成:企业级SSD的价值锚点,正在从“单点性能指标”转向“系统确定性”。
无论是KV Cache大规模卸载带来的架构迁移,还是QLC在高密度存储中的重新定位,抑或是固件层对延迟、QoS 与功耗的持续压缩,本质上都在指向同一个问题:存储不再只是容量与带宽的提供者,而是决定算力是否能够被稳定释放的基础变量。
在这个意义上,行业的竞争边界也在悄然上移。
单一硬件能力的差异正在被系统级能力所稀释,真正拉开差距的,是谁能更早理解AI工作负载的变化,并将其转化为可规模化、可持续优化的工程体系。
当算力、存储与网络进一步融合,数据中心的逻辑也将从“资源堆叠”走向“效率组织”。
而存储,正站在这一轮重构的交汇点上。
雷峰网原创文章,未经授权禁止转载。详情见转载须知。