Em um movimento que poderá redefinir as fronteiras da inteligência artificial, o Google anunciou a formação de uma nova equipe voltada para o desenvolvimento de modelos de IA capazes de simular o mundo físico em detalhes sem precedentes. A liderança deste novo projeto ficará por conta de Tim Brooks, que anteriormente co-liderou o gerador de vídeo Sora na OpenAI e que se juntou recentemente ao laboratório de pesquisa em IA Google DeepMind. Em uma publicação em sua conta na plataforma X, Brooks revelou suas ambições e o caminho que a equipe irá tomar.
A nova equipe será integrada ao Google DeepMind, uma área da empresa imersa na inovação e na exploração de IA de alta complexidade. Brooks anunciou que está recrutando para o time, destacando a intenção de desenvolver modelos generativos que possam simular de forma abrangente e realista o mundo. “A DeepMind tem planos ambiciosos para criar modelos generativos massivos que replicam a realidade”, afirmou Brooks em sua comunicação.
De acordo com as informações divulgadas, a nova equipe de modelagem colaborará e expandirá os trabalhos das equipes Gemini, Veo e Genie, que já estão na vanguarda do desenvolvimento de IA em suas respectivas áreas. O projeto Gemini, por exemplo, representa a principal série de modelos de IA do Google para tarefas como análise de imagens e geração de texto, enquanto Veo se dedica à geração de vídeos. Por sua vez, Genie se destaca por sua capacidade de simular jogos e ambientes 3D em tempo real, sendo que a mais recente versão do modelo Genie foi apresentada ao público em dezembro passado, demonstrando sua habilidade em gerar uma vasta gama de mundos jogáveis em 3D.
A busca pela inteligência artificial geral, ou AGI, é um objetivo que impulsiona as iniciativas de desenvolvimento da nova equipe. “Acreditamos que escalar o treinamento de IA em vídeo e dados multimodais é crucial para alcançar a inteligência geral artificial,” destaca uma das descrições das vagas. Essa forma de IA é entendida como aquela capaz de realizar qualquer tarefa que um ser humano possa executar. Os modelos de mundo, como são chamados, poderão ser aplicados em diversos domínios, incluindo raciocínio visual, simulação, planejamento para agentes incorporados e entretenimento interativo em tempo real.
A equipe sob a direção de Brooks terá por missão desenvolver ferramentas de “geração interativa em tempo real” com base nos modelos que construirão e investigar como integrar suas inovações com os modelos multimodais existentes, como o Gemini. Essa colaboração poderá abrir novas portas e possibilitar que os modelos atuem em conjunto para criar experiências mais estruturadas e atraentes.
O desenvolvimento de modelos de mundo está atraindo a atenção não apenas de gigantes da tecnologia, mas também de várias startups inovadoras no setor. Nomeados como World Labs, liderados pela proeminente pesquisadora de IA Fei-Fei Lee, e pela emergente empresa israelense Decart, entre outros, esses grupos acreditam que tais modelos podem um dia ser aplicados na criação de mídias interativas, como videogames e filmes, além de executar simulações realistas, por exemplo, em ambientes de treinamento para robôs.
Neste cenário, os profissionais criativos expressam sentimentos mistos em relação às inovações que a IA traz. Uma investigação recente realizada pela revista Wired revelou que estúdios de jogos, como a Activision Blizzard, têm recorrido à IA para aumentar a produtividade e compensar a perda de colaboradores. Em um estudo de 2024, encomendado pela Animation Guild, que representa animadores e cartoonistas em Hollywood, foi identificado que mais de 100 mil empregos na indústria de filmes, televisão e animação nos Estados Unidos poderão ser afetados pela IA até 2026.
Enquanto algumas startups, como a Odyssey, prometeram colaborar com os profissionais criativos, sem a intenção de substituí-los, a pergunta que paira no ar é se o Google seguirá uma abordagem semelhante. Outro aspecto que ainda permanece em aberto é a questão dos direitos autorais. Modelos de mundo, aparentemente, estão sendo treinados com trechos de vídeos de gameplays, o que poderia tornar suas desenvolvedoras alvos de processos judiciais caso os vídeos utilizados não tenham sido licenciados. O Google, por sua vez, alega que possui a permissão necessária para treinar seus modelos com vídeos do YouTube, em conformidade com os termos de serviço da plataforma, embora não tenha especificado quais vídeos adotou para essa finalidade.
À medida que o Google avança em sua jornada para desenvolver tecnologias que simulam a realidade, a curiosidade e o ceticismo permearão o debate sobre o impacto dessa nova era da inteligência artificial, não apenas nas indústrias criativas, mas no conjunto da sociedade. Sem dúvida, este é um momento crucial que pode moldar o futuro das interações humanas com máquinas inteligentes.