跳到主要内容

简介

我校的HPC AI融合智算中心拥有强大的计算能力和出色的稳定性,具有高度可扩展性,支持多机多卡、管理异构,是业内领先的智算中心。智算中心目前包括了一期、二期、三期(ACD)、EDA四个智算集群。

HPC一期智算集群于2022年4月开始正式运营,集群高性能计算算力达到0.246Pflops@FP64,智能算力达到5.280Pflops@FP16。集群包括12个Intel CPU计算节点和4个NVIDIA A30 GPU计算节点。集群高性能网络采用100Gb/s的InfiniBand,配套存储容量为701GB的并行文件系统。

HPC二期智算集群于2023年9月开始正式运营,包括HPC AI平台和国产AI平台两大部分。HPC AI平台的高性能计算算力达到6.454Pflops@FP64,智能算力达到180.204Pflops@FP16。HPC AI平台包括146个Intel CPU计算节点、20个AMD CPU计算节点、65个NVIDIA A800 GPU计算节点、15个NVIDIA A40 GPU计算节点。国产AI平台的智能算力达到19.040Pflops@FP16。国产AI平台包括8个Atlas 300T Pro 训练节点和2个Atlas 300V Pro 推理节点。二期智算集群高性能网络采用200Gb/s的InfiniBand,配套存储容量为2.3PB,包含309TB SSD和3.9PB HDD。

HPC三期(ACD)智算集群计划于2025年投入运行。集群智能算力达到1051.344Pflops@FP16。集群包括68个GPU ACD(Advanced Computing Devices)计算节点。集群高性能网络采用400Gb/s的RoCE V2,配套存储容量为17PB。

HPC EDA智算集群于2023年7月开始正式运营,集群高性能计算算力达到0.267Pflops@FP64,智能算力达到5.280Pflops@FP16。集群包括20个Intel CPU计算节点和4个NVIDIA A30 GPU计算节点。集群高性能网络采用200Gb/s的InfiniBand,配套存储容量为1.2PB的并行文件系统。