SB C&Sの最新技術情報 発信サイト

C&S ENGINEER VOICE

SB C&S

【第3回】InfiniBandソリューション NVIDIA Networking製品のご紹介

AI
2025.04.28

こんにちは。SB C&Sの幸田です。

前回の第2回記事では、InfiniBandについての概要をご紹介しました。
本記事では、NVIDIAが展開している具体的なInfiniBandプロダクトについてご紹介します。

NVIDIA Quantum - InfiniBandスイッチ

nvidia-infiniband-switch-ndr-400gbs-2c50-d-2x.jpeg
https://www.nvidia.com/ja-jp/networking/quantum2/

NVIDIAのInfiniBandスイッチは、Quantum という名を冠して展開されています。
上の画像は、2025年4月現在の主力プロダクトである NVIDIA Quantum-2 QM9700 シリーズのスイッチです。
1つのケージは400Gbps x2の800Gbpsで、OSFP (octal small form-factor pluggable) での接続が提供されます。OSFPには2分割されたケーブルが接続されます。
DGX H200, そしてDGX B200 など、現在提供されているハイエンドのノード間接続に対応しています。

また、すでに発表されている次世代の NVIDIA Quantum-X800 は、OSFPで接続が提供される単一ケージの帯域幅はなんと1.6Tbpsにも上ります。

Unified Fabric Manager (UFM) - 集約的な運用管理・パフォーマンス維持向上のためのツール

nvidia-unfified-fabric-manager-2c50-d.jpg
https://www.nvidia.com/ja-jp/networking/infiniband/ufm/

UFMは、NVIDIAのInfiniBandネットワークを集約して運用管理し、構成やパフォーマンスの監視・可視化、およびトラブルシューティングを実行するためのツールです。
小規模なInfiniBandネットワークであっても、このプロダクトを導入することでAI基盤のパフォーマンスを最大化しての運用管理が可能となるといえます。
なおUFMは、専用アプライアンス(物理機器)に加えて、Docker環境などで稼働するコンテナとしての実装も可能です。
通常の運用監視・可視化についてはどちらの実装でも利用可能で、さらに充実した機能 (高度な異常検知や予防保全、セキュリティリスクの検知など) を利用する場合はUFM Cyber-AI専用アプライアンスも展開されています。

ConnectX - HCA (ホストチャネルアダプタ)

connectx-8.png
https://www.nvidia.com/ja-jp/networking/infiniband-adapters/

サーバー側に搭載されるHCAは、ConnectXというシリーズとして展開されています。
前回第2回の記事でご紹介した、SHARPなどNVIDIA InfiniBandの高度な機能をサポートしています。
2025年4月現在の最新プロダクトは ConnectX-8 SuperNIC で、最大800Gbpsもの帯域幅をもちます。
なおConnectXシリーズはモデルによってInfiniBandとEthernetの両方に対応でき、ポート数も複数のパターンがありますので、要件にあわせて最適なものを選択することができます。

Linx-X - ケーブルおよびトランシーバー

スクリーンショット 2025-04-25 012504.png
https://www.nvidia.com/ja-jp/networking/products/interconnect/

ケーブルは光および銅線(Copper, DAC)のどちらも展開されており、光ケーブルをサーバーへ接続する場合に必要となるトランシーバーもNVIDIAが提供しています。
また、光ケーブルとトランシーバーが一体化したAOCケーブルもラインナップに入っています。
基本的に、ある程度以上の距離を接続する場合は光ケーブル、短い距離で済む場合は銅線ケーブルが選択され、複数のラックにまたがるAI基盤においては光ケーブルが選択されるケースが大半を占めるものと見受ています。
これら一連のケーブル、トランシーバー類のプロダクトは、LinkXと名付けられて展開されています。
スイッチ、HCA/NIC, DGXなど、NVIDIAのプロダクト間を接続する際のケーブル選定は、LinkX Configuration Maps などをご覧いただくと非常にスムーズに行えます。


加えて最後にご紹介したいのは、2025年3月に開催された NVIDIA 2025 において発表のあった、シリコンフォトニクスを採用した NVIDIA Photonics です。
シリコンフォトニクスとは、CPU, GPUなどのシリコン半導体で用いられる製造技術を応用して、大規模・高密度な「光回路」を構成する手法です。
NVIDIA Photonics通信速度のアップグレードに加え、大きな効果があるのが消費電力の低減です。
単に企業・組織のコスト削減という意味だけでなく、国家・地域の電力供給の逼迫に対処するうえで今後ますます重要になっていく技術であるといえます。
InfiniBand, Ethernetともにプロダクトの発表がありましたが、先に展開される予定となっているのはInfiniBandで、早くも2025年の後半には実際のプロダクトが提供される見込みです。
スクリーンショット 2025-03-20 230428.png
GTC 2025 Keynote より


InfiniBand プロダクトのご紹介は以上です。
なお弊社ではパートナー様およびNVIDIA社と協力し、InfiniBandネットワークを用いたAI基盤のご提案・ご導入をお手伝いする準備がございますので、機会がありましたら是非ともお問い合わせをいただければと思います。

次回および次々回は、NVIDIAのEthernetについてご紹介します。ご期待くださいませ。

著者紹介

SB C&S株式会社
ICT事業本部 技術本部 技術統括部 第1技術部 2課
幸田 章 - Akira Koda -

VDI を含む仮想化、クラウド、NVIDIA GPU によるコンピューティング(グラフィックス, AI/HPC)等のプリセールス・エンジニア業務に従事。
VMware vExpert 2015-2022