从DeepSeek AI推理大模型到今年爆火的OpenClaw AI智能体,端侧AI市场被彻底引爆。如果说AI大模型训练成就了HBM高带宽存储,那么端侧AI推理也必将重新定义端侧AI存储。这其中,国内存储龙头企业江波龙的“集成存储”绝对是独树一帜的存在。
在近日举行的CFM|MemoryS2026闪存峰会上,江波龙董事长、总经理蔡华波做了主旨演讲,重点谈及集成存储,探索端侧AI。江波龙两位高管也在峰会期间接受媒体采访,详细解读江波龙的端侧AI存储能力,与此同时公司围绕端侧AI发布存储系列新品和技术受到外界高度关注。
蔡华波在演讲中指出,随着AI推理应用的加速,AI分层存储清晰划分云端与端侧AI的存储服务核心差异。其中,云端AI聚焦面向GPU的专业化存储服务,而端侧AI围绕高性能容量、SiP系统级集成封装、定制化服务三大核心需求展开,其对存储的要求与过往标准存储生态存在本质区别。
正如消费级GPU与AI专用GPU分属截然不同的体系,前者依托通用芯片生态,后者面向完整AI系统产品打造,端侧AI同样需要深度集成的定制化存储方案,而非通用标准存储产品。基于这一精准定位,江波龙聚焦端侧AI集成存储解决方案,精准匹配AI手机、AI辅助驾驶、AI穿戴、AI PC、具身机器人等多元场景,为端侧AI存储创新锚定清晰的场景导向,与云端AI存储形成优势互补。
SPU+iSA加持,AI PC存储深度优化,温冷数据下沉SSD,大幅节省DRAM容量
江波龙副总裁、企业级存储事业部总经理闫书印表示,随着 AI 技术的不断发展,传统的数据分层模式正在发生改变。以往数据多以冷、热数据划分,如今温数据场景日益凸显。针对这一变化,江波龙推出SPU(Storage Processing Unit,存储处理单元)、iSA(Intelligence Storage Agent,存储智能体),以及HLC高级缓存技术,实现智能调度功能,并与主机厂进行联合开发,深化软硬件协同优化。
与常规SSD主控芯片不同,SPU是面向智能存储架构打造的专用处理单元,芯片基于5nm先进制程工艺打造,单盘最大容量达128TB,当前主流cSSD 容量最大仅至8TB,而大容量eSSD方案成本较高,SPU则有效平衡了容量与成本难题,可高效益替代HDD,为客户探索eSSD方案提供了新可能,同时有望显著降低整体拥有成本。
SPU核心具备存内无损压缩、HLC(High Level Cache)高级缓存技术两大关键能力,存内无损压缩平均压缩比达2:1,实测覆盖文本/代码/数据库等多类数据,大幅节省SSD容量和成本;还能通过HLC技术实现温冷数据下沉至SSD,节省近40% DRAM容量需求。
在展会现场,笔者看到江波龙与AMD基于锐龙AI Max+ 395处理器的智能体主机联合调优的实测数据,该设备实现397B超大模型本地部署,在256K超长上下文(122B)场景下,128GB内存即可流畅运行,从而将DRAM占用降低近40%,为超大模型本地化高效部署与规模化应用提供了创新的实践方案。

闫书印分析,KV缓存温数据通常存于本地 SSD,平衡容量与访问速度是端侧AI存储的重要方向。在AI PC端,HLC技术依托SPU实现分层设计,性能层打造AI专用高速缓存区,实现大模型专家 / 键值卸载,存储层负责操作系统与通用数据存储,通过高优先级读写、低优先级I/O调度,在优化AI体验的同时降低终端DRAM容量需求和成本。简单来说,通过HLC技术智能调度异构SSD盘,针对不同场景调度SLC或QLC,在性能和成本之间进行更好的平衡。
当然,除了硬件层面的SPU存储处理单元,江波龙在软件层面构建了iSA存储智能体,两者结合软硬件协同实现技术闭环。作为SPU的大脑,iSA存储智能体是面向端侧AI推理的智能调度引擎。针对MoE大模型参数庞大、KV Cache膨胀快、I/O延迟影响推理流畅度等问题,通过MoE专家卸载、KV Cache智能管理与智能预取算法,高效解决端侧AI推理的存储调度难题。江波龙在与AMD智能体主机联合调优案例中,主机安装iSA存储智能体后能够有效协同SSD进行调优,提升整机运行端侧AI的整体性能。
AI手机存储HLC技术与UFS协同,可穿戴极致尺寸打入多家主流AI眼镜
在嵌入式领域,HLC高级缓存技术与UFS深度集成,实现嵌入式端侧场景落地。以江波龙与紫光展锐联合开发,搭载紫光展锐芯片平台实测数据来看,4GB DDR搭配HLC技术后,20款App启动响应时间仅851ms,接近6GB/8GB DDR正常配置水平,且江波龙搭载14nm制程工艺WM7200主控的UFS 2.2产品,顺序读写最高可达1070MB/s、1000MB/s,随机读写IOPS分别最高可达240K、210K,超过行业主流水平,在保障流畅体验和器件使用寿命的前提下,有效降低终端DRAM容量需求、优化BOM成本。
江波龙副总裁、嵌入式存储事业部总经理黄强表示,从嵌入式产品来看,未来端侧AI对存储需求主要集中在高性能与大容量、SIP系统级集成以及定制化服务三大方向。
而江波龙穿戴产品线正是顺应了这一趋势,产品持续创新,应用进展迅速。据介绍,作为国内少数掌握系统级封装全流程设计能力的存储厂商,江波龙能够将SoC、eMMC/UFS、LPDDR、WiFi、蓝牙、NFC等多类芯片集成于一颗封装内。此次亮相的5.8mm × 6.3mm eMMC是当前业界已公开的最小尺寸eMMC产品。通过极致的封装设计,江波龙将闪存颗粒与自研主控高度集成,较江波龙上一代7.2*7.2mm超小尺寸eMMC,再次缩减了约30%的主板占用面积,为智能眼镜、手表等寸土寸金的穿戴结构进一步释放宝贵空间。
另一最新产品ePOP5x将高性能eMMC与LPDDR5x DRAM垂直堆叠于单一封装体内,LPDDR5x的传输速率为8533Mbps,厚度仅0.5mm。代表了当前嵌入式存储封装工艺的又一突破。该产品其超薄特性可完美嵌入超轻量AI眼镜的镜腿末端,在实现数据高速存取与内存高频运行的同时,为终端产品打造“无感佩戴”体验提供了关键硬件支撑。
在功耗表现上,两款新品均搭载了江波龙旗下慧忆微新一代自研eMMC主控芯片。通过对读写策略与Flash空间管理方式的深度优化,新品静态功耗相比上一代产品显著降低约250%,有效缓解了智能穿戴设备“一天一充”的续航焦虑,为全天候AI语音唤醒、健康监测等常时在线场景提供了坚实的硬件基础。
在封测层面,江波龙旗下元成科技作为公司高端封测制造基地,为穿戴存储产品提供了从晶圆级封装到系统级测试的全流程保障。元成科技拥有一条针对穿戴芯片特点定制的ESAT专品专线,可完成超薄高精度叠层封装及异构堆叠制造,可以实现-40°C至125°C宽温域的严苛可靠性测试。每一颗出厂的存储芯片均经过完整的电性能、老化、温循、跌落等验证,确保在户外眼镜、运动手表等严苛使用环境下依然保证持久稳定运行。
黄强表示,江波龙嵌入式存储的发展已经有十五年历程,在当前的AI大背景下嵌入式存储正从单一的标准化存储转向系统集成。江波龙通过“自研主控 + 固件算法 + 先进封测”,构建了从芯片定义到成品交付的全链路闭环。这种“自研主控+固件优化+自主封测” 的AI存储全链路定制服务Foundry模式,是江波龙区别于传统存储厂商的核心竞争力。它使江波龙能够在产品定义阶段即与客户深度协同,针对特定穿戴平台的算力要求、功耗和结构约束,进行从晶圆到成品的全链路定制化设计,将“通用存储”进化为“场景定义存储”。
据介绍,江波龙可穿戴类存储已进入多家主流AI眼镜厂商供应链,有望随着这一爆款品类的高速增长而成为公司潜力增长点。
小结:
无论是AI手机、AI PC还是龙虾盒子,看似端侧AI离我们很近又未真正触手可及,能够支持AI大模型和智能体本地化运行的存储系统级方案正是业界努力的方向。江波龙的集成存储以创新的技术和优异的性能表现将持续赋能端侧AI浪潮。
推荐阅读:







