A iniciativa MRC da OpenAI reforça o papel crescente da Ethernet nas redes back-end de IA

A iniciativa MRC da OpenAI reforça o papel crescente da Ethernet nas redes back-end de IA

A iniciativa MRC da OpenAI reforça o papel crescente da Ethernet nas redes back-end de IA

A rede está se tornando uma camada estratégica de IA

 

OpenAI, juntamente com um consórcio de grandes players de tecnologia, incluindo AMDBroadcom, Intel, Microsoft e NVIDIA introduziram um novo protocolo de rede projetado para evitar que congestionamentos e falhas de hardware interrompam clusters de IA em grande escala, ressaltando como a rede está se tornando tão estratégica quanto a própria computação.

O treinamento de IA em grande escala depende de milhares de GPUs trabalhando juntas em estreita sincronização. Quando uma parte da rede fica lenta ou falha, o impacto pode repercutir em todo o trabalho de treinamento. O Multipath Reliable Connection (MRC) concentra-se na redução desse risco, melhorando o desempenho, a resiliência e a previsibilidade em clusters XPU muito grandes.

 

Ethernet está migrando para o núcleo do supercomputador AI

Um dos sinais mais importantes deste anúncio é a mudança contínua do InfiniBand para redes de IA baseadas em Ethernet. A InfiniBand tem desempenhado um papel importante na computação de alto desempenho e nos clusters de IA, mas a Ethernet está se tornando cada vez mais atraente devido à sua escala, abertura, ampla base de fornecedores e familiaridade operacional.

A iniciativa MRC da OpenAI reforça o papel crescente da Ethernet nas redes back-end de IA

O MRC estende o RoCE, ou RDMA sobre Ethernet Convergente, e o combina com técnicas como pulverização de pacotes multipath e roteamento de origem SRv6 para tornar a Ethernet mais resiliente para cargas de trabalho de treinamento de IA síncronas.

Isso não significa que o InfiniBand desapareça da noite para o dia. Mas mostra que a Ethernet está evoluindo rapidamente de uma tecnologia de data center de uso geral para uma base séria para os maiores supercomputadores de IA. Para a indústria, isso importa. Um ecossistema Ethernet mais forte poderia reduzir a dependência de uma abordagem de rede única, expandir a participação dos fornecedores e dar aos fornecedores de nuvem e aos laboratórios de IA mais flexibilidade na forma como projetam a infraestrutura.

 

Padrões abertos são importantes em escala de IA

A segunda conclusão importante é a importância da abertura e da diversidade. A decisão da OpenAI de lançar a especificação MRC através do Open Compute Project é significativa porque a infraestrutura de IA está se tornando muito grande e complexa para que sistemas fechados e verticalmente isolados possam ser dimensionados com eficiência.

Os padrões abertos podem ajudar a alinhar fornecedores de silício, provedores de nuvem, criadores de sistemas e laboratórios de IA em torno de blocos de construção comuns.

 

A diversidade é um requisito prático, não apenas um princípio

Essa diversidade não é apenas filosófica. É prático. O mercado de infraestrutura de IA precisa de vários fornecedores de XPUs, NICs, switches, plataformas de nuvem e camadas de software. À medida que a procura por computação de IA continua a aumentar, a colaboração em todo o setor pode melhorar a resiliência, mitigar o risco de fornecimento, reduzir estrangulamentos e acelerar a implementação.

 

Da especificação à implantação no mundo real

A terceira conclusão importante é que o MRC não é apenas um conceito de pesquisa; já está sendo usado na produção. A OpenAI afirma que o MRC está implantado em seus maiores supercomputadores NVIDIA GB200, incluindo seu site com Oracle Cloud Infrastructure em Abilene, Texas, e os supercomputadores Fairwater da Microsoft. Ambos os exemplos foram implantados usando switches SpectrumX da NVIDIA.

De forma mais ampla, essas implantações validam a mudança acelerada em direção à Ethernet em clusters de IA de grande escala. De acordo com o Grupo Dell’Oro Switch de data center — relatório de redes back-end de IANVIDIA e Celestica capturaram 50% de Redes back-end de IA em 2025. A Arista ficou em terceiro lugar, apesar de uma parte significativa da receita de seus produtos relacionados à IA ter sido adiada.

Participação na receita do switch Ethernet Data Center em redes back-end de IA 2025

 

A mensagem da grande indústria

Para a indústria em geral, a mensagem é clara: a infraestrutura de IA está a entrar numa nova fase. A questão não é mais apenas quem tem mais XPUs, mas quem pode conectá-las com eficiência, operá-las de maneira confiável e mantê-las produtivas em grande escala.

A postagem A iniciativa MRC da OpenAI reforça o papel crescente da Ethernet nas redes back-end de IA apareceu primeiro em Grupo Dell’Oro.

Post Comment

You May Have Missed