DeepSeek V3/R1推論を進めた研究チームにおめでとうございます。



NVIDIA GB200 NVL72では、各GPUあたり26kの入力トークン/秒と13kの出力トークン/秒を達成しており、H100に対してほぼ4倍/5倍のスピードアップを実現しています。

彼らはこれをNVFP4 MoE、FP8アテンション、専門家の並列処理のスケーリングダウンで達成しました。
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • 7
  • リポスト
  • 共有
コメント
0/400
MEVSupportGroupvip
· 20時間前
4倍の向上はすごすぎるだろう
原文表示返信0
shadowy_supercodervip
· 21時間前
これもあまりにも競争が激しいですね
原文表示返信0
DefiOldTrickstervip
· 21時間前
老頭子は大風大浪に慣れている GPUも一秒月へ行けるぞ
原文表示返信0
DaoTherapyvip
· 21時間前
また技術革新の震えです
原文表示返信0
MerkleDreamervip
· 21時間前
味は悪くないですね、速度は天を突いています。
原文表示返信0
PanicSellervip
· 21時間前
また足りない、3090
原文表示返信0
0xLuckboxvip
· 21時間前
強気あ AIはこんなに速く走る
原文表示返信0
  • ピン
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)