2025/04/04
最新のベンチマークによると、NVIDIA B200を搭載したスーパーマイクロのシステムは、1秒あたりのトークン生成数が3倍で、前世代のシステムを凌駕している
カリフォルニア州サンノゼ, 2025年4月4日 /PRNewswire/ --AI/ML、HPC、クラウド、ストレージ、5G/エッジのトータルITソリューションプロバイダーであるスーパー・マイクロ・コンピューター社(Super Micro Computer, Inc.、略称SMCI)は、NVIDIA HGX™ B200 8-GPUを使用し、いくつかのMLPerf Inference v5.0ベンチマークで業界をリードするパフォーマンスを初めて発表しました。4U液冷システムと10U空冷システムは、一部のベンチマークで最高のパフォーマンスを達成しました。スーパーマイクロは、Llama2-70BおよびLlama3.1-405Bベンチマークにおいて、H200 8-GPUシステムと比較して、1秒あたりのトークン生成量(Token/s)が3倍以上であることを実証しました。
Nvidia HGX B200 Systems
「スーパーマイクロは、MLCommonsが2025年に初めて発表した新しいベンチマークからも明らかなように、AI業界のリーダーであり続けています」とスーパーマイクロの社長兼CEO、Charles Liang氏は述べています。「当社のビルディング・ブロック・アーキテクチャにより、さまざまなワークロードに最適化された多様なシステムをいち早く市場に投入することができます。我々は、システムを微調整し、AIワークロードにおけるリーダー的地位を確保するために、エヌビディア(NVIDIA)と緊密に協力し続けます。」
新しいMLPerf v5.0推論ベンチマークの詳細については、https://mlcommons.org/benchmarks/inference-datacenter/をご覧ください
スーパーマイクロは、空冷式と液冷式のNVIDIA HGX™ B200 8-GPUシステムの両方で、MLPerf推論性能の記録(一部のベンチマーク)を公表している唯一のシステム・ベンダーです。空冷式も液冷式も、MLCommonsのベンチマーク開始日以前には稼働していました。スーパーマイクロのエンジニアはシステムとソフトウェアを最適化し、素晴らしいパフォーマンスを披露しました。オペレーティング・マージンの範囲内で、スーパーマイクロの空冷B200システムは液冷B200システムと同レベルのパフォーマンスを示しました。スーパーマイクロは、ベンチマークを実施する間、これらのシステムを顧客に提供してきました。
MLCommonsは、すべての結果が再現可能であること、製品が入手可能であること、他のMLCommonsメンバーが結果を監査できることを重視しています。スーパーマイクロのエンジニアは、MLCommonsのルールに従ってシステムとソフトウェアを最適化しました。
SYS-421GE-NBRT-LCC(8x NVIDIA B200-SXM-180GB)とSYS-A21GE-NBRT(8x NVIDIA B200-SXM-180GB)は、Mixtral 8x7B Inference、Mixture of Expertsベンチマークを129,000トークン/秒で実行し、パフォーマンスでトップに立ちました。スーパーマイクロの空冷および液冷NVIDIA B200ベースのシステムは、大規模なLlama3.1-405bモデルで1,000トークン/秒を超える推論を実現しました。一方で、以前の世代のGPUシステムではその結果は大幅に低くなっていました。LLAMA2-70bベンチマークを使用した小規模な推論タスクでは、NVIDIA B200 SXM-180GBを搭載したスーパーマイクロ・システムが、ティア1システム・サプライヤの中で最高のパフォーマンスを示しています。
内容は次のようなものです。
• Stable Diffusion XL(サーバ)
SYS-A21GE-NBRT(8x B200-SXM-180GB)
#1 クエリー/秒、28.92
• llama2-70b-interactive-99(サーバ)
SYS-A21GE-NBRT(8x B200-SXM-180GB)
#1 トークン/秒、62,265.70
• ラマ3.1-405b(オフライン)
SYS-421GE-NBRT-LCC(8xB200-SXM-180GB)
#1 トークン/秒 1521.74
• Llama3.1-405b(サーバ)
SYS-A21GE-NBRT(8x B200-SXNM-180GB)
#1 トークン/秒、1080.31(8GPUノードの場合)
• mixtral-8x7b(サーバ)
SYS-421GE-NBRT-LCC(8x B200-SXM-180GB)
#1 トークン/秒、129,047.00
• mixtral-8x7b(オフライン)
SYS-421GE-NBRT-LCC(8x B200-SXM-180GB)
#1 トークン/秒、128,795.00ドル
「MLCommons は、スーパーマイクロの MLPerf Inference v5.0ベンチマークに提出した成果を祝福します。彼らの結果が、旧世代のシステムと比較して大幅な性能向上を示していることを嬉しく思います」とMLCommonsのMLPerf部門責任者であるDavid Kanter氏は述べています。「中立的で、代表的で、再現性のあるMLPerfの結果によって検証された性能向上が達成されたことで、顧客は満足することでしょう。」
スーパーマイクロは、100以上のGPU最適化システム、空冷および液冷オプション、シングルソケット最適化システムから8ウェイ・マルチプロセッサ・システムまで、CPUの選択肢を備えた包括的なAIポートフォリオを提供しています。スーパーマイクロのラックスケール・システムには、コンピューティング、ストレージ、ネットワークの各コンポーネントが含まれているため、顧客に納入された後の設置に要する時間が短縮されます。
スーパーマイクロのNVIDIA HGX B200 8 GPUシステムは、次世代の液体冷却および空冷テクノロジーを採用しています。新開発のコールドプレートと新しい 250kW 冷却剤分配ユニット (CDU) により、同じ 4U フォーム・ファクターで前世代の 2 倍以上の冷却能力が実現しました。42U、48U、または 52U 構成で利用可能で、新しい垂直冷却剤分配マニホールド (CDM) を備えたラックスケール設計により、貴重なラックユニットを占有することがなくなりました。これにより、42Uラックに64NVIDIA Blackwell GPUを搭載した8システム、52Uラックに96NVIDIA Blackwell GPUを搭載した最大12システムが可能になります。
新しい空冷式 10U NVIDIA HGX B200 システムは、8 つの 1000W TDP Blackwell GPU を収容できるように熱ヘッドルームが拡張された再設計されたシャーシを備えています。新しい10U空冷システムは最大4台までラックに設置して完全に統合でき、前世代と同じ密度で、最大15倍の推論パフォーマンスと3倍のトレーニング・パフォーマンスを実現します。
Supermicro (Super Micro Computer, Inc.)について
Supermicro(NASDAQ: SMCI)は、アプリケーションに最適化したハードウェアとトータルITソリューションのグローバルリーダーです。米国カリフォルニア州サンノゼで設立し、本社を置くSupermicroは、エンタープライズ、クラウド、AI、HPC、IoT/Edgeを含むITインフラストラクチャ市場に、いち早くイノベーションを提供することに取り組んでいます。当社は、サーバー、AI、ストレージ、IoT、ネットワークスイッチ、ソフトウェア、保守サービスを提供する、トータルITソリューションのメーカーです。Supermicroのマザーボード、電源、シャーシに至る設計の専門知識は、自社開発および生産の向上を可能にし、世界中のお客様に、クラウドからエッジまでの次世代のイノベーションを提供しています。当社の製品は、生産規模と効率のため、グローバルな運用を活用して米国、アジア、オランダにおいて、設計および製造しており、TCOの改善、環境への影響を減らすグリーンコンピューティングを目指した最適化を促進しています。数々の受賞歴をもたらしている当社独自のServer Building Block Solutions®は、様々なフォームファクター、プロセッサー、メモリー、GPUなどのアクセラレーター、ストレージ、ネットワーク、電源、冷却方式(空冷や液冷)の組み合わせの中から、お客様に合った最適な構成を構築することが可能であり、アプリケーションとワークロードの最適化を実現します。
Supermicro、Server Building Block Solutions、We Keep IT Greenは、Super Micro Computer, Inc.の商標および/または登録商標です。
Intel、Intel ロゴ、およびその他の Intel マークは、Intel Corporation またはその子会社の商標です。
その他すべてのブランド、名称、および商標は、それぞれの所有者に帰属します。