Discussões sobre a Capacidade das Máquinas em Imitar a Cognição Humana
No crescente debate em torno da Inteligência Artificial (IA), uma questão permanece central: os modelos atuais de IA realmente possuem capacidades de lembrança, raciocínio e planejamento semelhantes às do cérebro humano? Algumas empresas de IA alardeiam que sim, mas Yann LeCun, o principal cientista de IA da Meta, discorda veementemente dessa afirmação. Durante um recente evento no Hudson Forum, LeCun argumentou que as máquinas atuais ainda estão longe de alcançar um nível de inteligência equiparado ao humano, mas acredita que isso poderá mudar nas próximas décadas com o advento de uma nova abordagem, conhecida como “modelo de mundo”. Tal inovação, segundo ele, pode abrir caminho para IAs mais sofisticadas e com um entendimento mais apurado da realidade ao seu redor.
Desafios Atuais da Inteligência Artificial e a Nova Estratégia de Modelos de Mundo
Recentemente, a OpenAI introduziu um recurso denominado “memória” para o ChatGPT, permitindo que sua IA “lembre” das interações anteriores, além de exibir a palavra “pensando” durante a geração de respostas em sua mais recente geração de modelos, o o1. Mesmo com esses avanços, LeCun questiona se isso realmente se aproxima da chamada Inteligência Artificial Geral (AGI). O medo é que a hiperbolização sobre as funcionalidades prováveis das IAs atuais possa criar falsas expectativas sobre o que é, de fato, viável neste campo. LeCun reafirma que, para que possamos chegar a um modelo de IA que opere ao nível humano, precisamos desenvolver máquinas que realmente compreendam o mundo, possuam intuição, senso comum e a capacidade de planejar e raciocinar da mesma forma que os humanos. Em suas próprias palavras, ele frisa que “as atuais IAs não são capazes de realizar essas tarefas”. Ele deixa claro que, longe de ser uma breve viagem, a transição para a inteligência em nível humano pode ainda levar anos ou até mesmo décadas.
A razão para essa limitação é simples e técnica: os modernos modelos de linguagem, como o ChatGPT, funcionam através da previsão do próximo token, que geralmente se refere a algumas letras ou palavras, enquanto modelos de imagens e vídeos se concentram na previsão do próximo pixel. Embora esses modelos tenham se tornando habilidosos dentro de suas dimensões específicas, a limitação reside em sua incapacidade de entender de maneira tridimensional a complexidade do mundo real. Esta limitação é notadiamente crítica, especialmente quando se observa que enquanto uma criança pode aprender a arrumar a mesa em poucas horas ou a dirigir um carro aos 17 anos, os modelos de IA, mesmo os mais avançados, não conseguem operar de forma confiável no mundo físico, mesmo com milhares ou milhões de horas de dados à sua disposição.
Com isso em mente, LeCun defende que o caminho para o desenvolvimento de IAs que consigam realizar tarefas mais complexas envolve a construção de modelos tridimensionais que possam perceber o ambiente ao seu redor. Ele idealiza a criação de uma arquitetura de IA baseada em “modelos de mundo”. De acordo com LeCun, um “modelo de mundo” representa uma forma mental do comportamento do mundo, permitindo que o usuário imagine uma sequência de ações que resultariam em determinadas consequências. Por exemplo, ao visualizar um quarto bagunçado e querer organizá-lo, a mente humana é capaz de planejar as ações necessárias para cumprir esse objetivo sem a necessidade de experimentação ou aprendizado prévios.
A Relevância dos Modelos de Mundo e o Futuro da AI
A criação e a implementação de modelos de mundo têm se tornado uma ideia proeminente na comunidade de pesquisa em IA, atraindo considerável interesse e financiamento. Recentemente, um coletivo de respeitados pesquisadores em IA, incluindo Fei-Fei Li e Justin Johnson, angariou 230 milhões de dólares para a sua nova startup, World Labs. Essa equipe, liderada pela “madre de IA”, acredita que a adoção de modelos de mundo servirá como um divisor de águas para a criação de sistemas de IA mais inteligentes e eficientes. Assim como a OpenAI, que descreve o seu gerador de vídeo Sora como um modelo de mundo, outras empresas também estão começando a explorar essas possibilidades.
LeCun apresentou em um artigo de 2022 uma perspectiva sobre como estes modelos poderiam contribuir para a criação de uma IA em nível humano, embora note que a ideia já existe há mais de 60 anos. O conceito envolve a incorporação de representações básicas do mundo e de memórias em um modelo que prevê a realidade a partir dessa informação. A partir daí, metas específicas são imputadas, como a transformação do espaço em um estado desejado (por exemplo, arrumar um quarto) e restrições que garantam que a IA não cause danos ao tenter cumprir essas metas. Com isso, o modelo de mundo pode desenvolver uma sequência de ações para alcançar esses objetivos.
A Meta, por meio de seu laboratório de pesquisa em IA de longo prazo, conhecido como FAIR (Fundamental AI Research), está ativamente empenhada em desenvolver tanto a IA orientada a objetivos quanto os modelos de mundo, conforme indicado por LeCun. O laboratório, que anteriormente se concentrava em desenvolver IA para produtos da Meta, agora foca exclusivamente na pesquisa prolongada em IA, a ponto de descontinuar o uso de modelos de linguagem convencionais em suas operações atuais.
Embora os modelos de mundo representam uma ideia fascinante e promissora para o futuro da inteligência artificial, LeCun admitiu que ainda há muitos desafios a serem enfrentados antes que esses sistemas possam ser plenamente implementados. Ele enfatiza que a transição da teoria para a prática é muito mais complexa do que se imagina e que levará anos, se não uma década, para que conseguimos alcançar resultados efetivos. A expectativa de Mark Zuckerberg em relação a esse progresso, que frequentemente consulta LeCun sobre a cronologia dos avanços na AGI, destaca a urgência e a importância deste campo de pesquisa emergente.