Skip to main content

OpenAI获得的DGX B200的具体信息

·53 words·1 min
OpenAI DGX B200
Table of Contents

OpenAI 将通过最新的 DGX B200 平台利用 NVIDIA 的 Blackwell B200 数据中心 GPU 进行 AI 训练,本文将介绍DGX B200的一些规格信息。

DGX B200
#

DGX B200

DGX B200 System Specifications

DGX B200的电源要求
#

DGX B200 Power Supply

  • 每个DGX B200系统有6个电源模块,其中至少5个模块需要运行才能让系统正常工作。
  • 如果有1个电源模块故障,系统仍能继续运行。但如果有2个或更多的模块故障,系统就无法运行。这和是否有额外的备用电源无关。

DGX B200电源和散热规划
#

DGX B200 Power Supply and Cooling

DGX B200 Power Supply and Cooling

电路部署方式:
#

每个机架使用两条电路,每条电路需要能够处理机架一半的峰值用电量,并且要考虑断路器的安全裕量。

额外散热设备:
#

一些像 rear door heat exchangers 和 in-row coolers这样的额外散热设备通常不适合DGX B200系统。

DGX 超节点
#

DGX B200 Power Supply and Cooling

  • 每个48U/52U机架放置两个风冷的DGX B200

高密度部署的情况下,52U的机架可以放4个DGX B200

  • 机间互联采用IB网络

  • IB结构决定了机架间电缆距离的要求

  • DGX 超节点最多可以有127个DGX B200,每32个是一个单元。

Related

大厂加速自研AI芯片:Nvidia主导地位受到挑战
·17 words·1 min
AI GenAI NVIDIA GPU OpenAI
Apple M4 Max Tops Geekbench, Beating Intel and AMD
·450 words·3 mins
M4 Max Benchmark Apple Silicon MacBook Pro
NVIDIA Replaces Intel in Dow Jones Industrial Average
·428 words·3 mins
NVIDIA Dow Jones Intel Stock Market