No recente segmento de perguntas e respostas no Reddit, o CEO da OpenAI, Sam Altman, reconheceu que a falta de capacidade de computação é um dos principais obstáculos que têm dificultado o lançamento de novos produtos pela empresa com a frequência desejada. As suas declarações oferecem uma visão intrigante sobre as complexidades envolvidas no desenvolvimento de modelos de inteligência artificial, assim como os desafios encontrados no processo de inovação. A tecnologia evolui em um ritmo acelerado, mas a infraestrutura necessária para suportar essa inovação parece não acompanhar o mesmo compasso.
Altman respondeu a questionamentos sobre os atrasos nos novos modelos de IA, destacando que “todos esses modelos se tornaram bastante complexos”. O CEO fez um esforço para explicar que a OpenAI enfrenta limitações que vão além da simples programação. Ele indicou que a alocação dos recursos de computação é um dos desafios mais críticos, uma vez que a empresa possui uma série de ideias promissoras, mas deve fazer escolhas difíceis sobre como concentrar suas capacidades. Estima-se que a OpenAI tenha enfrentado dificuldades para garantir uma infraestrutura de computação robusta, necessária para operar e treinar seus modelos gerativos. Recentemente, o site de notícias Reuters trouxe à tona que a OpenAI está colaborando com a Broadcom para desenvolver um chip de IA destinado a rodar seus modelos, o que poderia ser lançado já em 2026.
Altman também mencionou que, devido a essa capacidade limitada, a Advanced Voice Mode, uma função anunciada como capaz de proporcionar conversas realistas no ChatGPT, não terá suas funcionalidades visuais – inicialmente previstas para serem apresentadas em abril – implementadas em breve. Durante o evento de imprensa em abril, a OpenAI exibiu uma demonstração do ChatGPT em um smartphone, mostrando sua capacidade de responder a dicas visuais, como as roupas que alguém estava usando, capturadas pela câmera do celular. Contudo, reportagens posteriores da Fortune revelaram que essa demonstração foi apressada com o intuito de desviar a atenção do concorrente Google durante o evento de desenvolvedores da empresa, realizado na mesma semana. Muitas pessoas dentro da OpenAI estavam reticentes quanto à prontidão do GPT-4o, que acabou sofrendo atrasos de meses, especialmente a versão que funcionaria somente por voz.
Em relação ao próximo lançamento do gerador de imagens da OpenAI, DALL-E, Altman afirmou que ainda não existe uma linha do tempo para seu lançamento. “Ainda não temos um plano de lançamento”, deixou claro. Enquanto isso, o Sora, a ferramenta de geração de vídeos da OpenAI, tem enfrentado obstáculos técnicos significativos que a colocam em desvantagem em relação a sistemas concorrentes, como os oferecidos por Luma, Runway, entre outros. Informações relatadas pelo site The Information indicaram que a versão original do Sora, apresentada em fevereiro, demandava mais de dez minutos de tempo de processamento para criar um clipe de vídeo de um minuto. Para piorar a situação, um dos co-líderes da ferramenta, Tim Brooks, deixou a OpenAI em outubro para se juntar ao Google.
Para a alegria de muitos usuários, mais adiante na conversa, Altman levantou a possibilidade de que a OpenAI considerasse permitir conteúdo “NSFW” (not safe for work) no ChatGPT em algum momento no futuro, enfatizando que “acreditamos totalmente em tratar os usuários adultos como adultos”. Ele ainda destacou que a prioridade máxima da empresa é a melhoria de sua linha de modelos de raciocínio da série o1 e seus sucessores, apresentando uma variedade de funcionalidades que serão lançadas ainda este ano, coincidentemente anunciadas durante a conferência DevDay em Londres, incluindo capacidades de compreensão de imagens. “Temos lançamentos muito bons chegando ainda este ano”, afirmou Altman, embora tenha sido cuidadoso ao não prometer nada que será chamado de GPT-5.
Este balanço entre inovação e limitação de infraestrutura destaca um aspecto fascinante do setor de tecnologia atual. Os avanços em inteligência artificial estão diante de um momento de inflexão, e enquanto empresas como a OpenAI tentam se manter na vanguarda do desenvolvimento, os desafios de hardware e decisões estratégicas moldarão o futuro de suas soluções. O que se deve considerar é que em meio àquelas dificuldades, a OpenAI ainda carrega a promessa de avanços significativos que podem transformar a interação humana com a tecnologia, desafiando constantemente as expectativas que cercam a IA. Assim, os usuários permanecem ansiosos pelo que virá a seguir, com a esperança de que, apesar das dificuldades de hoje, os frutos do trabalho árduo de amanhã trarão inovações que agradarão e surpreenderão a todos.