A iniciativa MRC da OpenAI reforça o papel crescente da Ethernet nas redes back-end de IA
A rede está se tornando uma camada estratégica de IA
OpenAI, juntamente com um consórcio de grandes players de tecnologia, incluindo AMDBroadcom, Intel, Microsoft e NVIDIA introduziram um novo protocolo de rede projetado para evitar que congestionamentos e falhas de hardware interrompam clusters de IA em grande escala, ressaltando como a rede está se tornando tão estratégica quanto a própria computação.
O treinamento de IA em grande escala depende de milhares de GPUs trabalhando juntas em estreita sincronização. Quando uma parte da rede fica lenta ou falha, o impacto pode repercutir em todo o trabalho de treinamento. O Multipath Reliable Connection (MRC) concentra-se na redução desse risco, melhorando o desempenho, a resiliência e a previsibilidade em clusters XPU muito grandes.
Ethernet está migrando para o núcleo do supercomputador AI
Um dos sinais mais importantes deste anúncio é a mudança contínua do InfiniBand para redes de IA baseadas em Ethernet. A InfiniBand tem desempenhado um papel importante na computação de alto desempenho e nos clusters de IA, mas a Ethernet está se tornando cada vez mais atraente devido à sua escala, abertura, ampla base de fornecedores e familiaridade operacional.
O MRC estende o RoCE, ou RDMA sobre Ethernet Convergente, e o combina com técnicas como pulverização de pacotes multipath e roteamento de origem SRv6 para tornar a Ethernet mais resiliente para cargas de trabalho de treinamento de IA síncronas.
Isso não significa que o InfiniBand desapareça da noite para o dia. Mas mostra que a Ethernet está evoluindo rapidamente de uma tecnologia de data center de uso geral para uma base séria para os maiores supercomputadores de IA. Para a indústria, isso importa. Um ecossistema Ethernet mais forte poderia reduzir a dependência de uma abordagem de rede única, expandir a participação dos fornecedores e dar aos fornecedores de nuvem e aos laboratórios de IA mais flexibilidade na forma como projetam a infraestrutura.
Padrões abertos são importantes em escala de IA
A segunda conclusão importante é a importância da abertura e da diversidade. A decisão da OpenAI de lançar a especificação MRC através do Open Compute Project é significativa porque a infraestrutura de IA está se tornando muito grande e complexa para que sistemas fechados e verticalmente isolados possam ser dimensionados com eficiência.
Os padrões abertos podem ajudar a alinhar fornecedores de silício, provedores de nuvem, criadores de sistemas e laboratórios de IA em torno de blocos de construção comuns.
A diversidade é um requisito prático, não apenas um princípio
Essa diversidade não é apenas filosófica. É prático. O mercado de infraestrutura de IA precisa de vários fornecedores de XPUs, NICs, switches, plataformas de nuvem e camadas de software. À medida que a procura por computação de IA continua a aumentar, a colaboração em todo o setor pode melhorar a resiliência, mitigar o risco de fornecimento, reduzir estrangulamentos e acelerar a implementação.
Da especificação à implantação no mundo real
A terceira conclusão importante é que o MRC não é apenas um conceito de pesquisa; já está sendo usado na produção. A OpenAI afirma que o MRC está implantado em seus maiores supercomputadores NVIDIA GB200, incluindo seu site com Oracle Cloud Infrastructure em Abilene, Texas, e os supercomputadores Fairwater da Microsoft. Ambos os exemplos foram implantados usando switches SpectrumX da NVIDIA.
De forma mais ampla, essas implantações validam a mudança acelerada em direção à Ethernet em clusters de IA de grande escala. De acordo com o Grupo Dell’Oro Switch de data center — relatório de redes back-end de IANVIDIA e Celestica capturaram 50% de Redes back-end de IA em 2025. A Arista ficou em terceiro lugar, apesar de uma parte significativa da receita de seus produtos relacionados à IA ter sido adiada.
A mensagem da grande indústria
Para a indústria em geral, a mensagem é clara: a infraestrutura de IA está a entrar numa nova fase. A questão não é mais apenas quem tem mais XPUs, mas quem pode conectá-las com eficiência, operá-las de maneira confiável e mantê-las produtivas em grande escala.
A postagem A iniciativa MRC da OpenAI reforça o papel crescente da Ethernet nas redes back-end de IA apareceu primeiro em Grupo Dell’Oro.




.png?w=1920&resize=1920,1075&ssl=1)
Post Comment