Já alguma vez se perguntou como é que 72 GPUs Blackwell funcionam como se fossem apenas um processador gigantesco? O segredo está na largura de banda do NVLink—estamos a falar de 130 terabytes por segundo.
Isto não é o típico cluster de GPUs. A arquitetura GB200 NVL72 cria basicamente uma máquina de computação unificada, com cada chip perfeitamente sincronizado. Porque é que isto importa? Estruturas de IA complexas, especialmente aqueles modelos Mixture-of-Experts como o DeepSeek-R1, precisam deste tipo de comunicação fluida entre unidades de processamento.
Pense nisto como a diferença entre 72 pessoas a gritar numa sala ou 72 cérebros a partilhar uma única rede neural. Essa velocidade de interligação faz toda a diferença quando se treinam modelos que precisam de transferir parâmetros entre diferentes módulos de especialistas em tempo real.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
9 gostos
Recompensa
9
7
Republicar
Partilhar
Comentar
0/400
MevWhisperer
· 14h atrás
130TB/s de largura de banda é realmente impressionante, é assim que um chip de IA deve ser.
Ver originalResponder0
fork_in_the_road
· 14h atrás
130TB/s? Wow, esta largura de banda é mesmo absurda, não admira que a DeepSeek consiga ser tão competitiva.
Ver originalResponder0
MemeCurator
· 14h atrás
130TB/s? Isto não é mais do que a Nvidia a exagerar nas especificações; se conseguir realmente usar metade disso em funcionamento, dou-me por derrotado.
Ver originalResponder0
rugpull_survivor
· 14h atrás
130TB/s de largura de banda NVLink une diretamente 72 GPUs como se fossem uma só, e é por isso que a DeepSeek consegue funcionar.
Ver originalResponder0
NFTArchaeologist
· 14h atrás
130TB/s de largura de banda... Isto sim é que é um verdadeiro nível monstruoso, não admira que a DeepSeek seja tão potente.
Ver originalResponder0
DefiPlaybook
· 14h atrás
130TB/s de largura de banda, esta é a trincheira da nvidia na corrida armamentista de poder de computação, certo? Em outras palavras, é sobre explorar o limite de eficiência dos chips, assim como a lógica de arbitragem nas Finanças Descentralizadas - a velocidade do fluxo de informação determina o vencedor.
Ver originalResponder0
MetaLord420
· 14h atrás
130TB/s? Esta largura de banda é realmente absurda, 72 placas GPU conseguem realmente utilizar tudo isso?
Já alguma vez se perguntou como é que 72 GPUs Blackwell funcionam como se fossem apenas um processador gigantesco? O segredo está na largura de banda do NVLink—estamos a falar de 130 terabytes por segundo.
Isto não é o típico cluster de GPUs. A arquitetura GB200 NVL72 cria basicamente uma máquina de computação unificada, com cada chip perfeitamente sincronizado. Porque é que isto importa? Estruturas de IA complexas, especialmente aqueles modelos Mixture-of-Experts como o DeepSeek-R1, precisam deste tipo de comunicação fluida entre unidades de processamento.
Pense nisto como a diferença entre 72 pessoas a gritar numa sala ou 72 cérebros a partilhar uma única rede neural. Essa velocidade de interligação faz toda a diferença quando se treinam modelos que precisam de transferir parâmetros entre diferentes módulos de especialistas em tempo real.