Nos últimos dias, a OpenAI apresentou uma atualização significativa para o ChatGPT, permitindo sua interação direta com alguns aplicativos do sistema operacional MacOS. Essa inovação representa um marco importante para desenvolvedores e usuários de tecnologia, pois simplifica bastante o processo de integração entre o ChatGPT e as ferramentas de programação utilizadas no dia a dia. A funcionalidade, chamada de “Trabalhar com Aplicativos”, foi anunciada na última quinta-feira e promete revolucionar a forma como os códigos são gerados e otimizados.
uma nova era para os desenvolvedores: facilidades na integração de códigos com o chatgpt
A partir dessa atualização, o ChatGPT terá a capacidade de ler códigos de um conjunto de aplicativos focados em desenvolvimento, como VS Code, Xcode, TextEdit, Terminal e iTerm2. Isso significa que os programadores não precisarão mais recortar e colar seus códigos na interface do ChatGPT para obter sugestões ou modificações. Com a nova funcionalidade ativada, as seções de código em que os desenvolvedores estão trabalhando serão automaticamente enviadas ao chatbot como contexto, acompanhadas do comando ou sugestão que estão fornecendo, tornando a experiência de codificação mais dinâmica e integrada.
No entanto, é importante ressaltar que, ao contrário de outras ferramentas populares de codificação assistida por IA, como Cursor ou GitHub Copilot, o ChatGPT ainda não consegue escrever códigos diretamente nos aplicativos de desenvolvimento. O objetivo da OpenAI com essa função não é desenvolver um agente de IA, mas sim estabelecer um “fundamento chave” para construir sistemas mais complexos e interativos no futuro. Um dos grandes desafios enfrentados atualmente pela IA é fazer com que sistemas como o ChatGPT compreendam não apenas os prompts ou suas próprias respostas, mas também todo o conteúdo visível na tela do usuário.
o futuro promissor do chatgpt: mais aplicativos e funcionalidades a caminho
O foco inicial da OpenAI em aplicativos de codificação se deve ao fato de que assistentes de codificação baseados em IA têm se tornado um dos usos mais populares e frequentemente demandados para modelos de linguagem de aprendizado de máquina. A funcionalidade “Trabalhar com Aplicativos” já está disponível para os usuários do ChatGPT Plus e Teams, sendo que a OpenAI planeja disponibilizá-la para usuários do Enterprise e Edu nas próximas semanas. Segundo a empresa, novas integrações com outros tipos de aplicativos poderão surgir, especificamente voltadas para tarefas de redação e escrita.
Em uma demonstração realizada com o TechCrunch, um funcionário da OpenAI apresentou a nova funcionalidade enquanto trabalhava em um projeto simples no Xcode que modelava o sistema solar, embora estivesse faltando o planeta Terra. Ao selecionar uma aba do Xcode dentro do ChatGPT, o colaborador pediu para que o chatbot “adicionasse os planetas que estavam faltando”. O resultado foi uma linha de código que representava o planeta Terra, seguindo o formato do restante do projeto. É válido destacar que eles ainda precisaram colar a resposta do ChatGPT de volta em seu ambiente de trabalho, o que mostra que ainda existe um caminho a ser percorrido para uma integração total.
Para garantir que o ChatGPT consiga ler diferentes aplicativos, a OpenAI recorre principalmente à Accessibility API do MacOS para interpretar textos e traduzi-los de maneira que possam ser compreendidos pelo chatbot. Essa tecnologia, que apóia o recurso VoiceOver da Apple, está presente há quase duas décadas e, geralmente, é considerada bastante confiável para a maioria dos aplicativos comuns. Contudo, ela não é compatível com todas as situações.
Por exemplo, para usar o “Trabalhar com Aplicativos” no VS Code, os usuários precisarão instalar uma extensão especial para consultar o conteúdo. Além disso, o recurso da tela de leitura da Apple é limitado a textos, o que significa que o ChatGPT não consegue interpretar elementos visuais, como imagens, orientações de objetos ou vídeos. O planejamento é que o “Trabalhar com Aplicativos” envie as últimas 200 linhas de código trabalhadas através do ChatGPT, junto com cada prompt, para aplicativos selecionados. Para outros, todo o código na janela ativa será utilizado como entrada para o chatbot, o que pode resultar em um uso elevado de tokens de entrada.
perspectivas para o futuro: evolução dos agentes de IA e novas funcionalidades
Embora o futuro exato dessa funcionalidade permaneça incerto, a OpenAI está atenta a novas possibilidades, especialmente em relação à ampliação dessa capacidade para outros aplicativos que atualmente não são compatíveis com a leitura de tela da Apple. A Anthropic, um dos concorrentes da OpenAI, lançou um sistema de IA que analisa capturas de tela do desktop do usuário para compreender e utilizar diferentes aplicativos. Embora essa abordagem tenha se mostrado lenta e sujeita a erros, ela representa uma alternativa que não depende de APIs e pode potencialmente levar a um agente de IA de uso mais geral.
“Esse recurso não é destinado a ser um agente, mas sim uma forma de colaboração com ferramentas de codificação. Pretendemos lançar mais ferramentas em breve”, afirmou Alexander Embiricos, responsável pelo produto de desktop da OpenAI, durante uma breve coletiva de imprensa. O avanço em direção a sistemas mais autônomos é lutado neste cenário, especialmente considerando os recentes relatórios que sugerem que a OpenAI está próxima de lançar um agente de IA de propósito geral, codinome “Operador”, que deve ser lançado até o começo de 2025. Esse novo sistema deve concorrer com outras iniciativas de agentes de IA, como o “Jarvis” da Google.
A OpenAI está, neste momento, lançando inicialmente essas funcionalidades no MacOS, um movimento que acontece pouco antes de um esperado lançamento de uma integração com o ChatGPT pela Apple em dezembro. Contudo, a data de disponibilização do “Trabalhar com Aplicativos” para o Windows, o sistema operacional apoiado pela Microsoft, maior investidor da OpenAI, permanece indefinida. O avanço contínuo nessas tecnologias sinaliza um futuro promissor, onde as interações entre inteligência artificial e ferramentas de desenvolvimento se tornam cada vez mais fluidas e integradas, potencializando a produtividade dos desenvolvedores e transformando o uso da tecnologia em ambiente de trabalho.