又双叒!龙存科技为万卡级智算中心筑牢存储“高速路”
又一次为万卡智算中心构建高性能文件存储系统
在人工智能产业蓬勃发展的背景下,万卡级智算中心已成为推动前沿技术突破的核心基础设施。近日,龙存科技凭借自主研发的高性能并行文件系统,成功完成又一例万卡规模智算中心存储项目部署,为超大规模AI 训练与推理提供关键数据存储支撑,这一成果再次巩固了其在智算存储领域的领先地位。
龙存为智算中心提升效率,降低成本!
此次部署的存储系统成功支撑 1400 余台计算节点作为文件系统客户端实现并发读写,满足超 10000 张高端 GPU 卡的超大规模 AI 训练与推理任务的数据存储需求。
LoongStore存储系统在实际运行中展现出三大核心技术优势:
1. 高带宽保障算力资源高效协同
LoongStore存储系统实现随着存储节点增加线性增长的聚合带宽和 IOPS,有效解决了高端智算环境中存储性能与算力资源匹配的关键问题。在 AI 训练与推理过程中,存储系统的读写性能直接影响 GPU 算力利用率。LoongStore 通过高速数据传输能力,确保前端 GPU 计算资源获得稳定的数据供给,显著提升计算任务的执行效率,降低资源闲置率。
2. 分布式元数据架构实现海量文件高效管理
针对AI 模型训练过程中产生的海量文件,LoongStore 展现出强大的处理能力。LoongStore存储系统单日文件创建量突破 170 亿,单文件系统存储容量达 5000 亿文件规模。依托分布式元数据服务架构,结合 NEST 小文件在线聚合技术,系统实现并行存储与响应,大幅提升元数据服务的响应速度与并发处理能力,有效应对万卡规模并行训练带来的高负载访问需求。

3. 动态存储策略优化成本与性能平衡
面对全闪硬件的高成本挑战,LoongStore 采用纠删码目录级灵活配置方案,可根据 AI 训练与推理不同阶段及数据类型,动态调整数据冗余保护等级。该策略在保障数据可靠性的同时,将存储系统空间利用率提升至 80%,相比传统方案降低 30% 以上的总体拥有成本(TCO),同时确保数据读写性能满足复杂计算任务需求。
LoongStore 大规模集群存储系统通过提升单节点性能、优化存储冗余策略,使智算中心在同等可用容量条件下,聚合并发读写性能实现翻倍增长。这一技术突破意味着,在相同预算范围内,智算中心可获得更高的存储容量与性能,显著提升整体运行效率与投资回报率。

从首套系统落地到如今多次成功服务万卡级智算中心,龙存科技扎根智算存储领域,以自主创新为驱动,将前沿技术转化为实际生产力。此次项目不仅实现了聚合并发读写性能的显著提升,更以更低的成本为客户创造了更高的存储价值,为智算中心的高效运营提供了新范式。未来,龙存科技将继续深耕技术研发,以更先进的存储解决方案赋能人工智能产业,与行业伙伴携手推动中国智算事业迈向新高度。
公司总部 · 北京
客服电话
400-803-6006
网销电话
400-803-6006
丨 最新动态
龙存高性能并行存储支持AI人工智能
异构混合存储,提速全国产化进程