感谢IT之家网友 华南吴彦祖 的线索投递!
,英特尔为美国阿贡国家实验室设计的 Aurora 超级计算机已经推迟了很长时间,但它终于成型了。
该系统由英特尔 Xeon CPU Max 和 Xeon GPU Max 系列芯片提供支持,与最初的 1 Exaflop 目标相比已升级为 2 Exaflop 算力,从而使它与基于 AMD 芯片的 Frontier 超级计算机相提并论。
英特尔透露,Aurora 超级计算机总共 10624 个节点,其中包括基于 Sapphire Rapids-SP 系列的 21,248 个 Xeon CPU 和基于 Ponte Vecchio 设计的 63,744 个 GPU,该系统可提供 2.12 PB/s 的峰值带宽和 0.69 PB/s 的峰值二分带宽。
对于内存,Aurora 超级计算机配备了 10.9 PB 的 DDR5 DRAM、1.36 PB 的 CPU HBM 和 8.16 PB 的 GPU HBM。
也就是说,这套系统 DRAM 达到了 5.95PB/s 的峰值带宽,CPU HBM 可提供 30.5PB/s 的峰值带宽,GPU HBM 则为 208.9PB/s 的峰值带宽。在存储方面,该系统配备了 230 PB 的 DAOS 容量,以 31 TB / s 的峰值带宽运行,总共配置了 1024 个节点。
得益于英特尔数据中心 GPU Max 系列处理器,Aurora 可实现最快的 SimpleFOMP 性能,超过 NVIDIA A100 和 AMD Instinct MI250X 加速器。
此外,英特尔还在聚变反应堆预测、蒙特卡洛方法和 QMCPACK(计算量子力学特性)中有着不输加速器的解决方案。
Aurora 超级计算机将在今年晚些时候进行升级,其峰值性能将超过 2 Exaflops。值得一提的是,这台超级计算机还将运行最新的 Aurora gen AI 模型,可提供 1 万亿个参数。
除了 Aurora超级计算机,英特尔还宣布了其全新的数据中心 GPU Max 子系统,该子系统采用 x8 UBB 设计,共有 8 个 Ponte Vecchio GPU。