Recentemente, a OpenAI anunciou a atualização de sua API com a introdução do modelo o1, uma inovação em inteligência artificial que prioriza o raciocínio lógico e a autoavaliação. Este novo modelo será disponibilizado inicialmente apenas para uma fração específica de desenvolvedores, o que levanta discussões sobre exclusividade e critérios de acesso no universo da tecnologia. A partir de hoje, o modelo começará a ser implementado para desenvolvedores qualificados que fazem parte da categoria “nível 5” de uso da OpenAI, conforme anunciado pela empresa.
Para ter acesso ao modelo o1, os desenvolvedores precisam atender a um conjunto de requisitos. Eles devem ter um gasto mínimo de $1.000 com a OpenAI e possuir uma conta que tenha sido criada há mais de 30 dias com um pagamento bem-sucedido. Embora essas condições possam ser consideradas rigorosas, a OpenAI justifica que a seleção cuidadosa de desenvolvedores é parte fundamental de sua estratégia de lançamento.
O modelo o1 representa uma evolução em relação ao o1-preview, que já estava disponível anteriormente na API. Uma das características mais marcantes desse tipo de IA é a capacidade de realizar uma “autoavaliação”, o que significa que o modelo pode verificar suas próprias afirmações para evitar erros comuns que costumam comprometer a eficácia de outros modelos de inteligência artificial. No entanto, essa capacidade de raciocínio aprofundado apresenta um custo, pois os modelos de raciocínio, como o o1, tendem a levar mais tempo para fornecer soluções em comparação com outras IAs tradicionais.
Os custos associados à utilização do modelo o1 são significativos. A OpenAI estipula uma taxa de $15 por cada aproximadamente 750.000 palavras que o modelo analisa, enquanto a geração de palavras custa $60 pelo mesmo número. Para se ter uma ideia, isso representa de três a quatro vezes o custo do modelo mais recente da OpenAI, o GPT-4o, classificado como “não-raciocínio”. Dessa forma, a implementação do modelo o1 e seu uso requerem um investimento considerável por parte dos desenvolvedores.
Outra inovação significativa trazida pelo modelo o1 é a sua alta personalização em comparação com seu antecessor, o o1-preview. Agora, os desenvolvedores podem utilizar funcionalidades como a chamada de funções para conectar o modelo a dados externos, mensagens para desenvolvedores que permitem instruir o modelo sobre tom e estilo, além de análise de imagens. O modelo também possui um parâmetro na API, denominado “reasoning_effort”, que habilita o controle sobre o tempo que o modelo “pensará” antes de responder a uma consulta. Esta nova abordagem proporciona maior flexibilidade e controle sobre como a IA interage com os usuários e os dados.
A OpenAI declarou que a versão do o1 disponível na API e que será integrada ao ChatGPT, sua plataforma de chatbot, é uma “nova versão pós-treinamento” do o1. Em comparação com o modelo o1 lançado recentemente no ChatGPT, conhecido como “o1-2024-12-17”, foi aprimorada em setores de comportamento do modelo, com base em feedbacks obtidos de usuários. A companhia afirmou que está adotando uma abordagem gradual para a liberação do acesso, enquanto trabalha para expandir o acesso a outros níveis de uso e aumentar os limites de taxa.
Além do foco no modelo o1, a OpenAI também revelou novos avanços em seus modelos GPT-4o e GPT-4o mini. Estas atualizações fazem parte da Realtime API, que permite a criação de aplicativos com respostas de voz geradas por IA em baixa latência. Os novos modelos, nomeados como “gpt-4o-realtime-preview-2024-12-17” e “gpt-4o-mini-realtime-preview-2024-12-17”, oferecem eficiência de dados aprimorada e são mais econômicos em relação ao uso, o que é um forte atrativo para os desenvolvedores que buscam soluções viáveis e dinâmicas.
Na linha das inovações, a Realtime API, que ainda se encontra em fase beta, agora conta com várias novas funcionalidades, incluindo respostas concorrentes fora do canal, permitindo que tarefas em segundo plano, como moderação de conteúdo, sejam realizadas sem interromper a interação do usuário. Além disso, a API agora suporta WebRTC, um padrão aberto para construir aplicações de voz em tempo real para navegadores, smartphones e dispositivos de internet das coisas. É interessante notar que, em uma jogada estratégica, a OpenAI contratou Justin Uberti, o criador do WebRTC, no início de dezembro.
A integração do WebRTC pela OpenAI foi particularmente destacada como uma forma de proporcionar interações fluídas e responsivas nas condições reais, mesmo em situações de qualidade de rede variável. A empresa afirmou em seu blog que esta tecnologia é capaz de lidar com codificação de áudio, streaming, supressão de ruído e controle de congestionamento. Para completar suas inovações, a OpenAI também introduziu o fine-tuning de preferências em sua API de ajuste fino, que compara pares de respostas de modelo para “ensinar” um modelo a distinguir entre respostas preferidas e “não preferidas”. Além disso, a companhia lançou uma versão beta para kits de desenvolvimento de software oficiais nas linguagens de programação Go e Java.
Com essas atualizações, a OpenAI continua a solidificar sua posição como líder no campo da inteligência artificial, oferecendo ferramentas que visam não apenas melhorar a experiência do desenvolvedor, mas também garantir que a IA funcione de maneira mais autônoma e inteligente. É uma era de inovação emocionante, e com certeza haverá mais por vir.