A Nvidia, gigante do setor de tecnologia, revelou recentemente resultados financeiros impressionantes, apontando para um lucro líquido superior a $19 bilhões no último trimestre. Essa performance financeira, embora positiva, não conseguiu completamente tranquilizar os investidores quanto à continuidade do crescimento acelerado da companhia. Durante uma teleconferência sobre os resultados financeiros, analistas questionaram o CEO Jensen Huang sobre como a Nvidia se adaptará caso empresas de tecnologia comecem a adotar novos métodos para aprimorar seus modelos de inteligência artificial (IA).
metodologias inovadoras e o futuro da inteligência artificial
Uma das inovações que recebeu destaque foi o método que fundamenta o modelo o1 da OpenAI, denominado “test-time scaling”. Essa abordagem sugere que os modelos de IA podem oferecer respostas mais precisas se tiverem tempo e capacidade computacional adicionais para processar as perguntas. Em termos específicos, esse método envolve a adição de mais capacidade computacional na fase de inferência da IA, que é tudo o que acontece após o usuário pressionar a tecla “enter” em seu comando.
Os analistas questionaram Huang sobre se ele observava uma migração de desenvolvedores de modelos de IA para esses novos métodos e qual seria o desempenho das antigas chips da Nvidia nessa nova abordagem de inferência. O CEO respondeu positivamente, afirmando que o o1, bem como o conceito de test-time scaling, poderia desempenhar um papel significativo nos negócios da Nvidia nos próximos anos, descrevendo-o como “um dos desenvolvimentos mais empolgantes” e “uma nova lei de escalabilidade”. Huang se esforçou para garantir aos investidores que a Nvidia está bem posicionada para essa transição.
As declarações do CEO da Nvidia assemelham-se ao que o CEO da Microsoft, Satya Nadella, mencionou recentemente em um evento, onde declarou que o o1 representa uma nova forma de a indústria de IA aprimorar seus modelos. Isso é um marco importante para a indústria de chips, pois coloca uma ênfase maior na inferência de IA. Embora as chips da Nvidia sejam considerados o padrão ouro para o treinamento de modelos de IA, há um crescente número de startups bem financiadas, como a Groq e a Cerebras, que estão desenvolvendo chips de inferência de IA de alta velocidade, criando um cenário competitivo mais desafiador para a Nvidia.
o cenário atual e futuro da inferência de IA
Apesar de relatos recentes indicando que as melhorias nos modelos generativos estão desacelerando, Huang afirmou que os desenvolvedores de modelos de IA ainda estão fazendo avanços significativos, aumentando a capacidade computacional e os dados durante a fase de pré-treinamento. Durante uma entrevista realizada no Cerebral Valley Summit, em São Francisco, o CEO da Anthropic, Dario Amodei, concordou em que não está percebendo uma desaceleração no desenvolvimento de modelos.
“A escalabilidade do pré-treinamento de modelos fundamentais está intacta e continua,” declarou Huang. “Como você sabe, isso é uma lei empírica, não uma lei física fundamental, mas as evidências demonstram que continua a escalar. O que estamos aprendendo, no entanto, é que não é o suficiente.” Essa foi uma afirmação que certamente trouxe alívio aos investidores da Nvidia, especialmente considerando que as ações da empresa dispararam mais de 180% em 2024, impulsionadas pela venda de chips de IA que OpenAI, Google e Meta utilizam para treinar seus modelos.
Contudo, parceiros da Andreessen Horowitz e vários outros executivos de IA já manifestaram anteriormente que esses métodos começam a apresentar retornos decrescentes. Huang ressaltou que, atualmente, a maioria das cargas de trabalho computacionais da Nvidia está concentrada no pré-treinamento de modelos de IA, e não na inferência, mas ele atribuiu isso mais à realidade do cenário atual da IA. O CEO expressou que, eventualmente, haverão mais pessoas executando modelos de IA, o que resultará em maior quantidade de inferência em IA. Ele destacou que a Nvidia é atualmente a maior plataforma de inferência do mundo, enfatizando que a escala e a confiabilidade da empresa oferecem uma vantagem considerável em relação às startups.
“Nossas esperanças e sonhos são que um dia o mundo realize muita inferência, e é nesse momento que a IA terá realmente alcançado o sucesso,” concluiu Huang. “Todos sabem que se inovarem sobre a CUDA e a arquitetura da Nvidia, poderão inovar com mais rapidez, e têm plena consciência de que tudo deve funcionar.” O futuro da Nvidia e da inteligência artificial parece ainda mais promissor, e a jornada de inovação continua.