Na quarta-feira, dia da revelação, a Google apresentou ao mundo o seu primeiro agente de Inteligência Artificial (IA) capaz de executar ações na web de forma autônoma, denominado Project Mariner. Este protótipo de pesquisa, desenvolvido pela divisão DeepMind da empresa, é equipado com a tecnologia Gemini e tem a capacidade de controlar o navegador Chrome, movendo o cursor, clicando em botões e preenchendo formulários, imitando assim o comportamento humano ao navegar em sites da internet. Este avanço tecnológico inaugura uma nova era de interação com a web, que pode transformar não apenas a forma como os usuários acessam informações, mas também remodelar como as empresas, desde publicadoras até varejistas, operam online.

Inicialmente, a Google está disponibilizando o Project Mariner para um grupo seleto de testadores. Essa iniciativa marca a primeira fase de um experimento em busca de novas maneiras para o Gemini ler, resumir e agora, atuar em websites. Executivos da empresa afirmam que isso representa uma ‘mudança fundamental no paradigma de experiência do usuário’ (UX), afastando os usuários da interação direta com as páginas. Ao contrário, eles irão interagir com um sistema de IA generativa que toma essas ações em nome deles, o que poderá ter um impacto significativo sobre milhões de negócios que dependem do tráfego real ao seus sites, como plataformas noticiosas e lojas virtuais.

Como Funciona o Project Mariner e Seus Desafios Iniciais

Durante uma apresentação exclusiva ao TechCrunch, Jaclyn Konzelmann, diretora do Google Labs, demonstrou o funcionamento do Project Mariner. Após a instalação de uma extensão no Chrome, uma janela de chat aparece ao lado do navegador, permitindo que o usuário forneça instruções ao agente de IA, como “criar um carrinho de compras em um supermercado com base nesta lista.” A partir desse ponto, o agente navegou até o site de um supermercado, neste caso, a Safeway, e buscou os itens solicitados para adicionar ao carrinho virtual. Contudo, a performance do agente apresentou uma limitação, com delays de cerca de cinco segundos entre cada movimento do cursor, levando-o a retornar à janela de chat em diversas ocasiões para buscar esclarecimentos sobre itens específicos, como a quantidade de cenouras a serem adquiridas.

Um aspecto importante a ser destacado é que, por questões de segurança e privacidade, o agente da Google não está programado para realizar pagamentos ou preencher informações sensíveis, como números de cartões de crédito. Ademais, o Project Mariner não aceita cookies dos usuários ou concorda com termos de serviço em seu nome. Essas diretrizes foram implementadas intencionalmente para garantir que os usuários ainda mantenham controle sobre suas ações na web.

Nos bastidores, por sua vez, o agente vem capturando capturas de tela do navegador, um procedimento que requer a concordância dos usuários em seus termos de serviço, enviando essas imagens para processamento na nuvem pelo Gemini, que então retorna com instruções de navegação ao computador do usuário. Além de ajudar na criação de listas de compras, o Project Mariner pode ser utilizado para buscar voos, reservar hotéis e receitas, tarefas essas que atualmente requerem que os usuários cliquem por meio da web.

Implicações para Usuários e Sites Além do Project Mariner

Um dos principais pontos a considerar é que o Project Mariner opera apenas na aba ativa do navegador Chrome, o que significa que os usuários não podem realizar outras tarefas em seus computadores enquanto o agente está em funcionamento. É preciso assistir ao Gemini clicando lentamente pelos sites. Koray Kavukcuoglu, CTO da Google DeepMind, comentou que essa decisão foi feita de maneira intencional para que os usuários possam visualizar o que o agente de IA está fazendo em seu nome. “Uma vez que o Gemini agora está tomando ações em nome dos usuários, é importante seguir este processo passo a passo”, disse ele. Na visão da empresa, o agente é complementar à interação humana, permitindo que o usuário utilize os sites e o agente faça tudo o que o usuário faria online.

Os donos de sites talvez se sintam aliviados ao saber que o agente operará na tela do usuário, pois isso garante que as publicações e lojas ainda tenham acesso à audiência. Contudo, as implicações desse novo sistema são profundas e podem levar à diminuição do engajamento dos usuários com os sites que visitam, eventualmente podendo eliminar a necessidade de interação do usuário com esses destinos online. A mudança provocada pelo Project Mariner pode, assim, exigir uma nova abordagem sobre como as editoras criam experiências para seus usuários e para os próprios agentes de IA.

Novos Agentes de IA e O Futuro da Interação com a Tecnologia

Além do Project Mariner, a Google também lançou outros agentes de IA para finalidades específicas. Um deles, denominado Deep Research, tem como objetivo auxiliar os usuários na exploração de tópicos complexos, criando planos de pesquisa em múltiplos passos. Apesar de competir com o modelo da OpenAI que realiza raciocínios em várias etapas, o porta-voz da Google salienta que este agente não é voltado para resolver problemas matemáticos ou lógicos, codificação, ou análise de dados. Com previsão de lançamento para o Gemini Advanced em breve, esse agente gerará relatórios detalhados baseados nas buscas realizadas.

Outro novo recurso apresentado, chamado Jules, pretende ajudar os desenvolvedores em suas tarefas de codificação, integrando-se diretamente aos fluxos de trabalho do GitHub. Com isso, Jules poderá visualizar e realizar alterações diretamente em projetos já existentes. O lançamento para um grupo restrito de testadores beta acontece agora, com uma expansão prevista para 2025.

Além disso, a Google está desenvolvendo um agente de IA que auxiliará na navegação em videogames, aproveitando a experiência acumulada da empresa na criação de IAs para jogos. A colaborarem com desenvolvedores, como a Supercell, a Google examina a capacidade do Gemini para entender e navegar em mundos de jogos como “Clash of Clans”. Embora não tenha sido dada uma data para o lançamento deste protótipo, essa pesquisa é fundamental para o desenvolvimento de agentes de IA que interajam com mundos físicos e virtuais.

O momento do lançamento do Project Mariner para a vasta base de usuários da Google ainda é incerto, mas à medida que esses agentes de IA se tornem uma realidade, espera-se um impacto significativo sobre a dinâmica da web. O ambiente online foi projetado para humanos, mas a introdução dos agentes de IA da Google pode mudar completamente esse paradigma, levando a uma nova era de interação digital que beneficiará tanto usuários quanto empresas.

Similar Posts

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *