Inovação em interconectores ópticos promete otimizar desempenho em inteligência artificial
A startup Lightmatter, especializada em computação fotônica, conseguiu levantar um expressivo investimento de 400 milhões de dólares em sua mais recente rodada de financiamento. Este aporte financeiro marca um avanço significativo em seus esforços para eliminar um dos gargalos mais desafiadores nos modernos centros de dados. Com um foco na interconexão óptica, a empresa possibilita que centenas de unidades de processamento gráfico (GPUs) operem em sincronia, facilitando o trabalho complexo e dispendioso de treinamento e execução de modelos de inteligência artificial. O crescimento exponencial da inteligência artificial, acompanhado de suas imensas exigências computacionais, tem propiciado o crescimento acelerado da indústria de centros de dados. Contudo, a simples adição de uma quantidade massiva de GPUs não se traduz em eficiência operacional. Especialistas em computação de alto desempenho têm consciência há anos de que a velocidade de cada nó em um supercomputador se torna irrelevante se grande parte deles permanecer ociosa, aguardando pela transferência de dados. A camada de interconexão é a responsável por integrar os racks de CPUs e GPUs em uma máquina coesa e expansiva; assim, a rapidez da interconexão se traduz diretamente na eficiência dos centros de dados. Nesse contexto, a Lightmatter se destaca por construir uma camada de interconexão que é significativamente mais rápida, utilizando chips fotônicos que vem desenvolvendo desde 2018.
A transformação dos centros de dados e o papel crítico da interconexão óptica
Em uma entrevista recente, Nick Harris, CEO e fundador da empresa, sublinhou que os grandes provedores de serviços em nuvem – conhecidos como hyperscalers – estão conscientes de que, para construir um computador com um milhão de nós, eles não podem depender das conexões tradicionais como as disponíveis em switches da Cisco. Ao sair da unidade de rack, a partir desse ponto as conexões interativas tornam-se limitadas, apresentando uma performance subpar. O estado da arte atual é representado pelo NVLink, especialmente na plataforma NVL72, que interconecta até 72 unidades Nvidia Blackwell em um único rack, alcançando uma capacidade máxima de 1,4 exaFLOPs em precisão FP4. No entanto, a interconexão de dados deve ser consolidada por meio de uma rede de 7 terabits, uma demanda que, embora impressionante, revela um dos principais obstáculos para a melhoria no desempenho geral. De acordo com Harris, para escalar a utilização de um milhão de GPUs, múltiplas camadas de switches se tornam necessárias, o que acarreta uma latência significativa. O processo de conversão de dados de elétrico para óptico e vice-versa é não somente demorado, mas também onera demasiadamente o consumo de energia à medida que os clusters se tornam maiores e mais complexos.
Diante disso, o diferencial que a Lightmatter traz é a utilização de fibra óptica. A proposta da empresa consiste na implementação de uma vasta quantidade de fibra, conectada através de uma interface puramente óptica. Cada fibra pode suportar até 1,6 terabits, empregando múltiplas cores, e cada chip pode conter até 256 fibras, o que representa avanços substanciais em comparação à limitação de 7 terabits por rack em sistemas tradicionais. A interconexão fotônica já disponível pela Lightmatter proporciona uma capacidade de 30 terabits, enquanto a fiação óptica em rack é capaz de permitir que 1.024 GPUs operem sincronamente em racks especialmente projetados. Harris explicou que as duas capacidades não aumentam proporcionalmente devido à natureza do processo de interconexão, onde muitos dados podem ser transmitidos dentro do rack ao invés de depender de uma rede externa, além de mencionar que a impressionante meta de 100 terabits já está em desenvolvimento.
O mercado de centros de dados e as expectativas futuras
Harris enfatizou que o mercado para essas soluções é vasto, com grandes empresas de centros de dados, como Microsoft e Amazon, bem como novos entrantes como xAI e OpenAI, demonstrando uma demanda incessante por capacidade computacional. A versatilidade das aplicações em um setor tão emergente sugere que a interconexão óptica irá desempenhar um papel fundamental no futuro da computação, que avança a passos largos. Embora muitos hyperscalers já utilizem a tecnologia da Lightmatter, Harris optou por não revelar nomes específicos, mas enfatizou que a empresa pode ser comparada a uma fundição, semelhante à TSMC, oferecendo uma plataforma que permite aos clientes expandirem seus próprios produtos. O crescimento exponencial da Lightmatter, refletido na recente avaliação de 4,4 bilhões de dólares, que representa um aumento significativo em relação à sua avaliação de meio de 2023, é um indicativo de que a empresa se tornou a maior do setor de fotônica. Questões como o aumento de capital e investimento em nova tecnologia são assuntos recorrentes no diálogo do setor, que observa como as inovações tecnológicas podem impactar as avaliações de empresas na cadeia de valor das computações em nuvem.
Por fim, o futuro da Lightmatter parece promissor com o desenvolvimento de novas soluções para aumentar a eficiência na interconexão, além da proposta de novos substratos para chips que permitirão realizar tarefas de rede ainda mais intimistas utilizando a luz. Harris especulou que, além da interconexão, a potência utilizada por chip deverá se tornar um grande diferenciador nos próximos anos, apontando que a perspectiva é de que em uma década todos os grandes players apresentem chips em escala de wafer, tornando-se crucial para a melhora de desempenho por chip. A Cerebras já está liderando o caminho nesta área, embora a capacidade de capturar plenamente o valor dessa tecnologia ainda seja uma questão em aberto. À medida que a indústria de chips enfrenta desafios, a Lightmatter se prepara para liderar as inovações que moldarão o futuro da computação, onde a interconexão poderá representar a próxima fronteira da Lei de Moore.