Félicitations à l'équipe de recherche pour l'avancement de l'inférence DeepSeek V3/R1.



Sur NVIDIA GB200 NVL72, ils atteignent 26k jetons d'entrée/s et 13k jetons de sortie/s par GPU — une accélération presque 4× / 5× par rapport à H100.

Ils ont réalisé cela avec NVFP4 MoE, attention FP8, parallélisme expert à échelle réduite.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • 7
  • Reposter
  • Partager
Commentaire
0/400
MEVSupportGroupvip
· Il y a 7h
C'est vraiment trop incroyable d'avoir une augmentation de 4 fois.
Voir l'originalRépondre0
shadowy_supercodervip
· Il y a 7h
C'est vraiment trop compétitif.
Voir l'originalRépondre0
DefiOldTrickstervip
· Il y a 7h
Le vieux est habitué aux tempêtes, le GPU peut aussi décoller en une seconde.
Voir l'originalRépondre0
DaoTherapyvip
· Il y a 7h
Encore une secousse d'innovation technologique
Voir l'originalRépondre0
MerkleDreamervip
· Il y a 7h
Ça a l'air pas mal, la vitesse est incroyable.
Voir l'originalRépondre0
PanicSellervip
· Il y a 7h
Pas assez de performances, 3090.
Voir l'originalRépondre0
0xLuckboxvip
· Il y a 8h
Bull, l'IA court si vite.
Voir l'originalRépondre0
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)