A semana do AWS re:Invent, o grandioso evento anual de computação em nuvem da Amazon, ocorreu em Las Vegas, trazendo uma série de inovações impressionantes. Em um momento de efervescência tecnológica, a gigante da tecnologia aproveitou a ocasião para revelar atualizações importantes, muitas das quais não poderiam ser abarrotadas em apenas cinco sessões principais, devido à sua relevância. Entre os anúncios mais significativos dessa edição, destaca-se a adoção de sistemas de resfriamento líquido para seus servidores de inteligência artificial, uma mudança que promete revolucionar a eficiência operacional e a sustentabilidade dos processos de computação em nuvem da empresa.
O uso de resfriamento líquido não é uma simples inovação; trata-se de uma estratégia cruciais para otimizar a performance dos servidores que utilizam os chips desenvolvidos pela própria Amazon, conhecidos como Trainium, bem como aqueles com aceleradores da Nvidia. Segundo a AWS, o resfriamento líquido será aplicado tanto aos chips Trainium2—que ainda estão em fase de pré-visualização—quanto a soluções avançadas de supercomputação em rack, como o NVIDIA GB200 NVL72. Essa inclusão de novas tecnologias não só amplia a capacidade de processamento, mas também potencializa a eficiência energética, um ponto vital para as data centers em tempos de crescente demanda por recursos computacionais.
A AWS fez questão de esclarecer que esses sistemas de resfriamento foram desenhados para integrar tanto métodos de resfriamento a ar quanto a líquido. Essa flexibilidade garante que diversos modelos de servidores, como aqueles que gerenciam armazenamento e redes, que não exigem resfriamento líquido, também sejam mantidos operacionais na mais alta eficiência. “Esse design de resfriamento multimodal permite à AWS fornecer o máximo de performance e eficiência ao menor custo, independente de estarem sendo executadas cargas de trabalho tradicionais ou modelos de IA”, explicou a empresa em seu comunicado oficial.
Além disso, a AWS anunciou que está aperfeiçoando os designs elétricos e mecânicos de seus servidores e racks de servidores. Com isso, a empresa visa garantir a disponibilidade da infraestrutura em níveis impressionantes de 99,9999%. Esse esforço inclui a simplificação das distribuições elétricas e dos sistemas mecânicos, que, segundo a empresa, reduzirá em 89% o número potencial de racks que poderiam ser afetados por problemas elétricos. Este objetivo é parcialmente alcançado pela diminuição das etapas de conversão de energia elétrica ao transferi-la da rede elétrica para os servidores, evitando a complexidade das conversões AC-DC-AC, que muitas vezes são responsáveis por perdas significativas.
Prasad Kalyanaraman, vice-presidente de Serviços de Infraestrutura da AWS, ressaltou que a empresa “continua inovando sem descanso em sua infraestrutura para construir a nuvem mais performática, resiliente, segura e sustentável para os clientes em todo o mundo”. Kalyanaraman ainda sublinhou que essas novas capacidades na data center representam um progresso importante com aumento da eficiência energética e suporte flexível para as demandas de cargas de trabalho emergentes. Para tornar essas inovações ainda mais interessantes, ele destacou que os sistemas são projetados para serem modulares, permitindo que a infraestrutura existente seja adaptada para o resfriamento líquido e eficiência energética, com o objetivo de potencializar as aplicações de inteligência artificial generativa e reduzir a pegada de carbono.
A perspectiva é de que essa nova abordagem inovadora possibilite um aumento impressionante de seis vezes na densidade de energia dos racks nos próximos dois anos, com uma previsão de crescimento adicional de três vezes no futuro. Para assegurar a máxima eficiência, a AWS também implementará inteligência artificial que ajudará a prever as melhores posições para os racks dentro das data centers, de modo a minimizar o uso de energia não utilizada ou subutilizada. A companhia também deve implantar um sistema de controle proprietário, que será incorporado a seus dispositivos elétricos e mecânicos, trazendo serviços de telemetria integrados para diagnósticos em tempo real e resolução de problemas.
Ian Buck, vice-presidente de hyperscale e HPC da Nvidia, declarou que “as data centers devem evoluir para atender às demandas transformadoras da IA”. A criação de avançadas soluções de resfriamento líquido permitirá que a infraestrutura de IA seja resfriada de maneira eficiente, minimizando o uso de energia. O trabalho colaborativo com a AWS no design dos racks de resfriamento líquido proporcionará aos clientes a capacidade de executar cargas de trabalho exigentes de IA com desempenho e eficiência excepcionais.
Portanto, as inovações apresentadas pela AWS durante o re:Invent não apenas prometem otimizar suas operações, mas também oferecem um vislumbre empolgante do futuro da computação em nuvem, onde a eficiência energética e a sustentabilidade andam lado a lado com a performance e a inovação tecnológica. Estar atento a essas mudanças pode ser o primeiro passo para quem deseja acompanhar a evolução dos serviços de nuvem e a forma como interagimos com a inteligência artificial.