Já alguma vez se perguntou como é que 72 GPUs Blackwell funcionam como se fossem apenas um processador gigantesco? O segredo está na largura de banda do NVLink—estamos a falar de 130 terabytes por segundo.
Isto não é o típico cluster de GPUs. A arquitetura GB200 NVL72 cria basicamente uma máquina de computação unificada, com cada chip perfeitamente sincronizado. Porque é que isto importa? Estruturas de IA complexas, especialmente aqueles modelos Mixture-of-Experts como o DeepSeek-R1, precisam deste tipo de comunicação fluida entre unidades de processamento.
Pense nisto como a diferença entre 72 pessoas a gritar numa sala ou 72 cérebros a partilhar uma única rede neural. Essa velocidade de interligação faz toda a diferença quando se treinam modelos que precisam de transferir parâmetros entre diferentes módulos de especialistas em tempo real.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
9 Curtidas
Recompensa
9
7
Repostar
Compartilhar
Comentário
0/400
MevWhisperer
· 14h atrás
130TB/s de largura de banda é realmente impressionante, é assim que um chip de IA deve ser.
Ver originalResponder0
fork_in_the_road
· 14h atrás
130TB/s? Wow, esta largura de banda é mesmo absurda, não admira que a DeepSeek consiga ser tão competitiva.
Ver originalResponder0
MemeCurator
· 14h atrás
130TB/s? Isto não é mais do que a Nvidia a exagerar nas especificações; se conseguir realmente usar metade disso em funcionamento, dou-me por derrotado.
Ver originalResponder0
rugpull_survivor
· 14h atrás
130TB/s de largura de banda NVLink une diretamente 72 GPUs como se fossem uma só, e é por isso que a DeepSeek consegue funcionar.
Ver originalResponder0
NFTArchaeologist
· 14h atrás
130TB/s de largura de banda... Isto sim é que é um verdadeiro nível monstruoso, não admira que a DeepSeek seja tão potente.
Ver originalResponder0
DefiPlaybook
· 14h atrás
130TB/s de largura de banda, esta é a trincheira da nvidia na corrida armamentista de poder de computação, certo? Em outras palavras, é sobre explorar o limite de eficiência dos chips, assim como a lógica de arbitragem nas Finanças Descentralizadas - a velocidade do fluxo de informação determina o vencedor.
Ver originalResponder0
MetaLord420
· 14h atrás
130TB/s? Esta largura de banda é realmente absurda, 72 placas GPU conseguem realmente utilizar tudo isso?
Já alguma vez se perguntou como é que 72 GPUs Blackwell funcionam como se fossem apenas um processador gigantesco? O segredo está na largura de banda do NVLink—estamos a falar de 130 terabytes por segundo.
Isto não é o típico cluster de GPUs. A arquitetura GB200 NVL72 cria basicamente uma máquina de computação unificada, com cada chip perfeitamente sincronizado. Porque é que isto importa? Estruturas de IA complexas, especialmente aqueles modelos Mixture-of-Experts como o DeepSeek-R1, precisam deste tipo de comunicação fluida entre unidades de processamento.
Pense nisto como a diferença entre 72 pessoas a gritar numa sala ou 72 cérebros a partilhar uma única rede neural. Essa velocidade de interligação faz toda a diferença quando se treinam modelos que precisam de transferir parâmetros entre diferentes módulos de especialistas em tempo real.